RAID 5: Una configurazione efficacie per garantire l'integrità dei dati

Written By: Ontrack

Date Published: 6 novembre 2023

RAID 5: Una configurazione efficacie per garantire l'integrità dei dati

Healthy RAID 5 Array

Un array RAID è un insieme di più hard disk configurati da un software o da un controller hardware in un determinato modo per proteggere i dati o migliorare le prestazioni. RAID sta per array ridondante di dischi indipendenti (redundant array of independent disks). Esistono diversi tipi di array RAID che influenzano le velocità di lettura e scrittura, nonché la ridondanza o la tolleranza ai guasti.

Sviluppato nei primi anni '80, la configurazione RAID 5 è la più comune e fornisce un buon compromesso tra tolleranza agli errori e prestazioni. Un array RAID 5 richiede almeno tre dischi e offre una maggiore velocità di lettura, ma non migliora le prestazioni di scrittura. Questa configurazione RAID può tollerare il guasto di un hard disk.

Come si presenta una configurazione RAID 5?

L'array RAID 5 contiene almeno 3 unità e utilizza il concetto di ridondanza o parità (parity) per aumentare la sicurezza dei dati senza sacrificare le prestazioni.

Analogamente a un array RAID 0, che esegue lo stripping dei dati su più unità per migliorare le prestazioni, un RAID 5 esegue lo stripping dei dati ma aggiunge intervalli di parity bit (parity) per aumentarne la sicurezza in caso di guasto dei supporti. I dati contenuti nella parity, nella maggior parte delle configurazioni RAID 5, sono uno XOR dei dati delle altre strisce (stripes). Questo rende il RAID 5 più economico da implementare rispetto al RAID 10, in quanto solo una porzione delle unità è allocato per la parità, e consente una maggiore flessibilità e dimensioni del volume rispetto al RAID 1.

Healthy RAID 5 Array

Nell'esempio precedente, la parità trovata sull'unità 4 per la prima striscia è lo XOR dei dati delle strisce denominate Data 1, Data 2 e Data 3. La parità trovata nella seconda striscia sull'unità 3 è lo XOR delle strisce di dati denominate Data 4, Data 5 e Data 6.

A cosa serve la parità in un RAID 5?

La presenza di un blocco di ridondanza o di parità in ogni striscia di dati consente al sistema di ricostruirsi nel caso in cui uno degli hard disk si guasti o vada offline. Il controller RAID o il software RAID possono ricostruire virtualmente qualsiasi segmento di dati mancante utilizzando la parity.

RAID 5 Array with One Failed Drive

Nell'esempio precedente, vediamo che un'unità è guasta. Quando si verifica il malfunzionamento di un'unità, l'array passa in modalità degradata. In questa modalità, il controller RAID combina le strisce di dati con la parity per presentare dati validi al sistema operativo. Nel nostro esempio, il controller combinerà i data 1, i data 3 e la parity della prima striscia, per sostituire i dati mancanti nel data 2. Nella seconda striscia, i data 4 e i data 6 saranno combinati con la parity per sostituire i data 5. Nella terza striscia non è necessaria la parity, poiché sono presenti tutti i dati delle unità.

Come funziona un Hot Spare in un array RAID 5?

Healthy RAID 5 Array with Hot Spare

Un hot spare è un'unità aggiuntiva che può essere implementata in un array RAID 5 per consentire un rapido ripristino da un'unità guasta. Nell'esempio precedente, vediamo un array RAID 5 funzionante con l'aggiunta di un hot spare. Si noti che l’hot spare non contiene dati fino a quando non si verifica un guasto ed è necessario utilizzare l’unità per la salvaguardia dei dati.

In caso di malfunzionamento, se il sistema dispone di un hot spare, il controller inizierà automaticamente a ricostruire i dati mancanti dall'unità guasta sull'hot spare.

RAID 5 Array with One Failed Drive + Hot Spare

Nell'esempio precedente, l'unità 2 si è guastata. Il sistema ha utilizzato l'hot spare e ha ricostruito tutti i dati mancanti dall'unità 2 all'hot spare.

Quando un drive si guasta, il tempo è un fattore importante per il rebuilding. Infatti, l'esecuzione in modalità degradata sottopone a ulteriori sollecitazioni le unità rimanenti e può causare ulteriori guasti se non viene risolta rapidamente. La disponibilità di uno o più hot spare consente tempi di ripristino più rapidi.

È possibile recuperare i dati da RAID 5?

Il recupero dei dati da un array RAID 5 guasto è possibile. Anche se il recupero dei dati può essere complesso e impegnativo, l’intervento in genere si conclude con successo. Le cause della perdita di dati sono molteplici e per ognuna di esse il recupero è diverso. Di seguito sono riportati alcuni esempi:

Recupero dei dati con un'unità guasta

RAID 5 Array with One Failed Drive

Se un'unità si guasta in un array, la parità può essere utilizzata per ricostruire i dati mancanti. In questo scenario, Ontrack è solitamente in grado di recuperare il 100% dei dati. Quando ci troviamo di fronte ad un array non funzionante, le unità del sistema vengono sottoposte a imaging in camera bianca. Tali immagini vengono utilizzate nella ricostruzione virtuale dell’array. Una volta ricostruito il RAID, il file system o il volume vengono analizzati al fine di correggere eventuali danni ed estrarne i dati. Spesso non è necessario avere accesso all’unità guasta, poiché i dati mancanti possono essere ricostruiti dalla parity.

Recupero dati da più unità guaste

RAID 5 Array with Multiple Failed Drives

Quando si hanno più unità guaste, il processo di recupero è simile a quello appena descritto. Quando interveniamo su un array non funzionante, le unità vengono sottoposte a imaging in camera bianca. È importante eseguire il più possibile l'imaging di ciascuna unità guasta, per consentire il recupero di un maggior numero di dati.

Quindi l'array viene ricostruito virtualmente utilizzando queste immagini. Nell'esempio, i data 2, i data 3 e la parity della striscia 1 vengono usati per ricostruire i data 1. La parity non è necessaria nella seconda striscia, poiché tutti i blocchi di dati sono presenti. Nel terzo stripe, i data 7, la parity e i data 8 vengono combinati per sostituire i data 9.

Una volta che l'array RAID è stato virtualmente riassemblato, il file system o il volume vengono analizzati al fine di correggere eventuali danni. Oltre ad ovviare al danneggiamento del file system, i tecnici cercano di individuare anche dati non coerenti o non aggiornati. Questo scenario si verifica quando c’è un gap temporale tra il guasto delle unità ed una di esse è degradata. I tecnici di data recovery devono avere un’opportuna esperienza per riconoscere questo tipo di danno e poter riparare virtualmente il volume ed estrarre dati validi.

Iscriviti

KLDiscovery Ontrack (Switzerland) GmbH, Hertistrasse 25, 8304 Wallisellen, Schweiz (Mostra tutte le località)