Un array RAID è un insieme di più hard disk configurati da un software o da un controller hardware in un determinato modo per proteggere i dati o migliorare le prestazioni. RAID sta per array ridondante di dischi indipendenti (redundant array of independent disks). Esistono diversi tipi di array RAID che influenzano le velocità di lettura e scrittura, nonché la ridondanza o la tolleranza ai guasti.
Sviluppato nei primi anni '80, la configurazione RAID 5 è la più comune e fornisce un buon compromesso tra tolleranza agli errori e prestazioni. Un array RAID 5 richiede almeno tre dischi e offre una maggiore velocità di lettura, ma non migliora le prestazioni di scrittura. Questa configurazione RAID può tollerare il guasto di un hard disk.
Come si presenta una configurazione RAID 5?
L'array RAID 5 contiene almeno 3 unità e utilizza il concetto di ridondanza o parità (parity) per aumentare la sicurezza dei dati senza sacrificare le prestazioni.
Analogamente a un array RAID 0, che esegue lo stripping dei dati su più unità per migliorare le prestazioni, un RAID 5 esegue lo stripping dei dati ma aggiunge intervalli di parity bit (parity) per aumentarne la sicurezza in caso di guasto dei supporti. I dati contenuti nella parity, nella maggior parte delle configurazioni RAID 5, sono uno XOR dei dati delle altre strisce (stripes). Questo rende il RAID 5 più economico da implementare rispetto al RAID 10, in quanto solo una porzione delle unità è allocato per la parità, e consente una maggiore flessibilità e dimensioni del volume rispetto al RAID 1.
Nell'esempio precedente, la parità trovata sull'unità 4 per la prima striscia è lo XOR dei dati delle strisce denominate Data 1, Data 2 e Data 3. La parità trovata nella seconda striscia sull'unità 3 è lo XOR delle strisce di dati denominate Data 4, Data 5 e Data 6.
A cosa serve la parità in un RAID 5?
La presenza di un blocco di ridondanza o di parità in ogni striscia di dati consente al sistema di ricostruirsi nel caso in cui uno degli hard disk si guasti o vada offline. Il controller RAID o il software RAID possono ricostruire virtualmente qualsiasi segmento di dati mancante utilizzando la parity.
Nell'esempio precedente, vediamo che un'unità è guasta. Quando si verifica il malfunzionamento di un'unità, l'array passa in modalità degradata. In questa modalità, il controller RAID combina le strisce di dati con la parity per presentare dati validi al sistema operativo. Nel nostro esempio, il controller combinerà i data 1, i data 3 e la parity della prima striscia, per sostituire i dati mancanti nel data 2. Nella seconda striscia, i data 4 e i data 6 saranno combinati con la parity per sostituire i data 5. Nella terza striscia non è necessaria la parity, poiché sono presenti tutti i dati delle unità.
Come funziona un Hot Spare in un array RAID 5?
Un hot spare è un'unità aggiuntiva che può essere implementata in un array RAID 5 per consentire un rapido ripristino da un'unità guasta. Nell'esempio precedente, vediamo un array RAID 5 funzionante con l'aggiunta di un hot spare. Si noti che l’hot spare non contiene dati fino a quando non si verifica un guasto ed è necessario utilizzare l’unità per la salvaguardia dei dati.
In caso di malfunzionamento, se il sistema dispone di un hot spare, il controller inizierà automaticamente a ricostruire i dati mancanti dall'unità guasta sull'hot spare.
Nell'esempio precedente, l'unità 2 si è guastata. Il sistema ha utilizzato l'hot spare e ha ricostruito tutti i dati mancanti dall'unità 2 all'hot spare.
Quando un drive si guasta, il tempo è un fattore importante per il rebuilding. Infatti, l'esecuzione in modalità degradata sottopone a ulteriori sollecitazioni le unità rimanenti e può causare ulteriori guasti se non viene risolta rapidamente. La disponibilità di uno o più hot spare consente tempi di ripristino più rapidi.
È possibile recuperare i dati da RAID 5?
Il recupero dei dati da un array RAID 5 guasto è possibile. Anche se il recupero dei dati può essere complesso e impegnativo, l’intervento in genere si conclude con successo. Le cause della perdita di dati sono molteplici e per ognuna di esse il recupero è diverso. Di seguito sono riportati alcuni esempi:
Recupero dei dati con un'unità guasta
Se un'unità si guasta in un array, la parità può essere utilizzata per ricostruire i dati mancanti. In questo scenario, Ontrack è solitamente in grado di recuperare il 100% dei dati. Quando ci troviamo di fronte ad un array non funzionante, le unità del sistema vengono sottoposte a imaging in camera bianca. Tali immagini vengono utilizzate nella ricostruzione virtuale dell’array. Una volta ricostruito il RAID, il file system o il volume vengono analizzati al fine di correggere eventuali danni ed estrarne i dati. Spesso non è necessario avere accesso all’unità guasta, poiché i dati mancanti possono essere ricostruiti dalla parity.
Recupero dati da più unità guaste
Quando si hanno più unità guaste, il processo di recupero è simile a quello appena descritto. Quando interveniamo su un array non funzionante, le unità vengono sottoposte a imaging in camera bianca. È importante eseguire il più possibile l'imaging di ciascuna unità guasta, per consentire il recupero di un maggior numero di dati.
Quindi l'array viene ricostruito virtualmente utilizzando queste immagini. Nell'esempio, i data 2, i data 3 e la parity della striscia 1 vengono usati per ricostruire i data 1. La parity non è necessaria nella seconda striscia, poiché tutti i blocchi di dati sono presenti. Nel terzo stripe, i data 7, la parity e i data 8 vengono combinati per sostituire i data 9.
Una volta che l'array RAID è stato virtualmente riassemblato, il file system o il volume vengono analizzati al fine di correggere eventuali danni. Oltre ad ovviare al danneggiamento del file system, i tecnici cercano di individuare anche dati non coerenti o non aggiornati. Questo scenario si verifica quando c’è un gap temporale tra il guasto delle unità ed una di esse è degradata. I tecnici di data recovery devono avere un’opportuna esperienza per riconoscere questo tipo di danno e poter riparare virtualmente il volume ed estrarre dati validi.
Sistemi RAID a confronto
RAID 5 vs. RAID 1
Sia il RAID 1 che il RAID 5 offrono una elevata tolleranza ai guasti.
Utilizzando il sistema di mirroring, il RAID 1 replica i dati e ne mantiene una copia esatta sui dispositivi di memoria, a vantaggio della sicurezza delle informazioni. Questo tipo di configurazione richiede solo due dischi e, grazie alla copia di backup, se uno dei due dischi dovesse guastarsi, i dati sarebbero disponibili sul secondo dispositivo. Il sistema RAID 5, invece, richiede almeno 3 hard disk e, anche per questa configurazione, è possibile recuperare i dati in caso di guasto di un dispositivo. A differenza del RAID1, il RAID 5 offre maggiori performance in fase di scrittura e una maggiore capacità di memorizzazione.
RAID 5 vs. RAID 6
Il RAID 5 permette di mantenere i vostri dati perfettamente intatti in caso di guasto di uno degli hard disk utilizzati.
Tuttavia, se dovessero verificarsi dei problemi su più dischi contemporaneamente, i dati potrebbero perdersi e risultare inutilizzabili. È qui che entra in gioco il RAID 6. Per superare i limiti della configurazione RAID 5, i progettisti hanno creato un sistema che permette di mantenere tutti i dati, anche in caso di guasto a più di una unità di storage. Inoltre, se il RAID 5 è veloce in termini di lettura e più lento in scrittura (a causa del calcolo dei bit di parità), il RAID 6 è piuttosto performante a tutti i livelli.
RAID 5 vs. RAID 10
Il RAID 10, conosciuto anche come RAID 1 + 0, è una combinazione del sistema RAID 1 e di quello RAID 0.
Il RAID 10 richiede almeno 4 unità di memoria ed offre un alto livello di sicurezza. Nel caso di guasto di un disco, il sistema continuerà a funzionare e la sicurezza dei dati viene garantita. A differenza del RAID 5, che richiede almeno 3 unità di memoria e garantisce la protezione dei dati in caso di guasto di una singola unità, ma non in caso di doppio guasto, il RAID 10 offre un'ottima affidabilità e prestazioni elevate. Scegliere tra RAID 5 e RAID 10 dipende dalle esigenze specifiche, ma se stai cercando un sistema con elevata sicurezza dei dati e prestazioni veloci, il RAID 10 potrebbe essere la scelta migliore per te.