Vai al contenuto
BeoHosting
BeoHosting
Technical

Cos'è il RAID e perché è importante per i server

BeoHosting Team··10 min read di lettura
Cos'è il RAID e perché è importante per i server

Cos'è il RAID

RAID è l'acronimo di Redundant Array of Independent Disks. Il RAID è una tecnologia che combina più dischi fisici in un'unica unità logica per migliorare le prestazioni, aumentare la capacità o garantire la ridondanza dei dati, oppure una combinazione di questi obiettivi. Il RAID è una tecnologia fondamentale per i server perché assicura il funzionamento continuo anche quando uno o più dischi si guastano, cosa di estrema importanza negli ambienti di hosting perché un'interruzione significa perdita di ricavi e di reputazione.

Il concetto di RAID risale al 1988, quando i ricercatori della UC Berkeley proposero di usare più dischi economici invece di un singolo disco costoso per migliorare affidabilità e prestazioni. Da allora il RAID si è evoluto ed è oggi lo standard nell'infrastruttura dei server. Comprendere i livelli RAID è importante per chiunque gestisca un server o scelga un hosting, perché incide direttamente sulla sicurezza dei dati e sulle prestazioni.

RAID 0 - Striping

Come funziona

Il RAID 0 distribuisce i dati in modo uniforme su due o più dischi senza alcuna ridondanza. Quando viene scritto un file, i dati vengono suddivisi in blocchi scritti alternativamente su dischi diversi. Questo processo si chiama striping perché i dati vengono distribuiti in strisce su tutti i dischi dell'array. Per esempio, un file da 100 MB su due dischi verrebbe suddiviso così che il primo disco memorizza i blocchi 1, 3, 5 e il secondo i blocchi 2, 4, 6, ottenendo lettura e scrittura in parallelo.

Vantaggi e svantaggi

Il vantaggio principale del RAID 0 sono le prestazioni notevolmente migliorate, perché le operazioni di lettura e scrittura vengono distribuite simultaneamente su più dischi. Due dischi in RAID 0 forniscono teoricamente il doppio della velocità di lettura e scrittura rispetto a un singolo disco. La capacità totale è la somma di tutti i dischi, quindi due dischi da 1 TB danno 2 TB di spazio utilizzabile. Tuttavia, il RAID 0 non ha ridondanza, il che significa che se un disco qualsiasi si guasta, tutti i dati vengono persi in modo irrecuperabile. In realtà, l'affidabilità del RAID 0 è inferiore a quella di un singolo disco, perché il guasto di un disco qualsiasi dell'array distrugge tutti i dati. Per questo motivo il RAID 0 non viene mai usato per i server di produzione o per l'hosting, perché il rischio di perdita dei dati è inaccettabile.

RAID 1 - Mirroring

Come funziona

Il RAID 1 crea una copia identica dei dati su due o più dischi tramite un processo chiamato mirroring. Ogni dato scritto sul primo disco viene scritto simultaneamente sul secondo disco. Se un disco si guasta, l'altro contiene una copia completa di tutti i dati e il sistema continua a funzionare senza interruzioni. Quando il disco guasto viene sostituito con uno nuovo, il sistema ricostruisce automaticamente la copia dei dati sul nuovo disco tramite un processo chiamato rebuild.

Vantaggi e svantaggi

Il RAID 1 offre un'eccellente ridondanza, perché il sistema può sopravvivere al guasto di un disco senza perdita di dati e senza interruzioni. Le prestazioni in lettura migliorano perché i dati possono essere letti da entrambi i dischi simultaneamente, ma le prestazioni in scrittura sono uguali o leggermente inferiori rispetto a un singolo disco, perché ogni dato deve essere scritto due volte. Lo svantaggio principale è la perdita di capacità, perché viene utilizzata solo metà della capacità totale dei dischi. Due dischi da 1 TB in RAID 1 danno solo 1 TB di spazio utilizzabile. Il RAID 1 è una scelta eccellente per i dischi di sistema dei server e per configurazioni più piccole in cui la ridondanza è una priorità.

RAID 5 - Striping con parità

Come funziona

Il RAID 5 combina lo striping con la parità distribuita e richiede un minimo di tre dischi. I dati vengono suddivisi in blocchi e distribuiti su tutti i dischi dell'array insieme alle informazioni di parità. La parità è un blocco calcolato matematicamente che consente la ricostruzione dei dati se un disco si guasta. I blocchi di parità sono distribuiti in modo uniforme su tutti i dischi invece di essere concentrati su un singolo disco, eliminando il collo di bottiglia in scrittura. Quando un disco si guasta, il sistema usa i dati rimanenti e le informazioni di parità per ricostruire i dati persi.

Vantaggi e svantaggi

Il RAID 5 offre un buon equilibrio tra prestazioni, capacità e ridondanza. La capacità utilizzabile è pari a N meno 1 dischi, dove N è il numero totale di dischi, quindi cinque dischi da 1 TB forniscono 4 TB di spazio utilizzabile con 1 TB di spazio destinato alla parità. Le prestazioni in lettura sono eccellenti perché i dati vengono letti da più dischi in parallelo. Il sistema può sopravvivere al guasto di un disco ma non di due, perché la perdita di un secondo disco prima del completamento del processo di rebuild comporterebbe la perdita di tutti i dati. Il processo di rebuild su dischi di grandi dimensioni può richiedere ore o persino giorni, durante i quali l'array è vulnerabile. Per questo il RAID 5 è considerato meno sicuro per dischi di grandi capacità moderne.

RAID 6 - Striping con doppia parità

Come funziona

Il RAID 6 è un'estensione del RAID 5 che usa due blocchi di parità indipendenti invece di uno e richiede un minimo di quattro dischi. Due diversi algoritmi di calcolo della parità garantiscono che il sistema possa sopravvivere al guasto simultaneo di due dischi senza perdita di dati. Si tratta di un miglioramento significativo rispetto al RAID 5, perché elimina la vulnerabilità durante il processo di rebuild. Se un disco si guasta e un secondo disco si guasta prima del completamento del rebuild, i dati sono comunque al sicuro perché i due blocchi di parità consentono la ricostruzione.

Vantaggi e svantaggi

Il RAID 6 offre il più alto livello di ridondanza tra i livelli RAID standard, con la capacità di sopravvivere al guasto di due dischi simultaneamente. La capacità utilizzabile è pari a N meno 2 dischi, quindi sei dischi da 1 TB forniscono 4 TB di spazio utilizzabile. Le prestazioni in lettura sono simili a quelle del RAID 5, ma le prestazioni in scrittura sono inferiori perché per ogni operazione di scrittura devono essere calcolati e scritti due blocchi di parità. Il RAID 6 è consigliato per array di grandi dimensioni con dischi ad alta capacità, dove la probabilità del guasto di un secondo disco durante il rebuild è significativa e dove la perdita di dati è inaccettabile.

RAID 10 - Combinazione di mirroring e striping

Come funziona

Il RAID 10 combina il mirroring del RAID 1 e lo striping del RAID 0, richiedendo un minimo di quattro dischi. I dischi vengono prima combinati in coppie che si specchiano come RAID 1, poi queste coppie vengono combinate in uno stripe RAID 0. Per esempio, con quattro dischi, i dischi 1 e 2 si specchiano e i dischi 3 e 4 si specchiano, con i dati distribuiti in striping tra questi due mirror. Questo significa che ogni dato esiste in due copie su dischi diversi e le operazioni di lettura e scrittura vengono parallelizzate.

Vantaggi e svantaggi

Il RAID 10 offre le migliori prestazioni tra tutti i livelli RAID con ridondanza, perché combina la velocità dello striping con la sicurezza del mirroring. Le prestazioni in lettura e scrittura sono eccellenti perché le operazioni vengono distribuite su più dischi. Il sistema può sopravvivere al guasto di un disco in ciascuna coppia in mirroring senza perdita di dati. Il rebuild è veloce perché viene copiato solo il contenuto di un disco invece di ricostruirlo tramite parità. Lo svantaggio principale è la perdita di metà della capacità come nel RAID 1, quindi quattro dischi da 1 TB forniscono 2 TB di spazio utilizzabile. Il RAID 10 è preferito per i database e le applicazioni a elevata intensità di scrittura, dove le prestazioni sono fondamentali.

Il RAID nel contesto dell'hosting

Come i provider di hosting usano il RAID

I provider di hosting professionali usano il RAID su tutti i server per garantire affidabilità e prestazioni. I server di web hosting usano tipicamente il RAID 1 per i dischi di sistema e il RAID 5 o RAID 6 per i dischi di archiviazione con i dati degli utenti. I server di database preferiscono il RAID 10 grazie alle prestazioni in scrittura superiori. L'hosting moderno con unità SSD migliora ulteriormente le prestazioni, perché gli SSD hanno tempi di accesso molto più rapidi e un throughput più elevato rispetto alle unità meccaniche.

Il RAID non sostituisce il backup

È fondamentale capire che il RAID non è un backup. Il RAID protegge dal guasto hardware del disco, ma non protegge dalla cancellazione accidentale di file, dalla corruzione dei dati, da attacchi di virus, da bug del software o da disastri come incendi o allagamenti. Se cancelli accidentalmente un file, il RAID cancellerà diligentemente la copia su tutti i dischi dell'array. Se un ransomware cifra i dati, il RAID cifrerà le copie su tutti i dischi. Per questo un backup regolare su una posizione separata è essenziale indipendentemente dalla configurazione RAID. La strategia ideale è il RAID per l'alta disponibilità più il backup per la protezione dalla perdita di dati.

RAID hardware vs RAID software

Il RAID hardware usa un controller RAID dedicato con processore e memoria propri per gestire l'array di dischi. I vantaggi sono prestazioni migliori perché le operazioni RAID non gravano sul processore principale del server, il supporto a funzioni avanzate come la sostituzione hot-swap dei dischi senza spegnimento, e una cache di scrittura con batteria di backup che protegge i dati in caso di interruzione di corrente. Il RAID software usa il processore e il sistema operativo per gestire il RAID, opzione più economica ma con prestazioni inferiori. Il mdadm di Linux è un popolare strumento RAID software. Per i server di hosting è consigliato il RAID hardware, perché offre prestazioni più affidabili sotto carico.

Conclusione

La tecnologia RAID è il fondamento di un server di hosting affidabile, che garantisce che il guasto di uno o più dischi non porti a perdita di dati o interruzione del servizio. Il RAID 1 è ideale per configurazioni più piccole con due dischi, il RAID 5 offre un buon equilibrio per array medi, il RAID 6 garantisce sicurezza aggiuntiva per array di grandi dimensioni e il RAID 10 offre le migliori prestazioni con ridondanza per le applicazioni più esigenti. Con BeoHosting, tutti i nostri server usano configurazioni RAID con unità SSD e backup regolari, garantendo massima affidabilità, velocità e sicurezza dei dati per il tuo sito.

BeoHosting Team

10+ anni di esperienza — Specialisti di web hosting e infrastrutture

  • Web Hosting
  • WordPress Hosting
  • VPS
  • Dedicated Serveri
  • Domeni
  • SSL
  • cPanel
  • LiteSpeed
  • Linux administracija
  • DNS

Ultimo aggiornamento: