RAID: Approfondimenti di Base

Written By: Ontrack

Date Published: 07/08/23 9.14

RAID: Approfondimenti di Base

Cos'è un RAID?

Il RAID (Redundant Array of Independent Disk) ha rivoluzionato la tecnologia di archiviazione dei dati aziendali grazie alla tecnologia della ridondanza (dalle configurazioni RAID 1 e successive versioni), che riduce notevolmente i periodi di inattività causati da guasti ai singoli hard disk.

Sfortunatamente, però, quella RAID non è una tecnologia perfetta e, di conseguenza, si possono sempre verificare casi di perdita dei dati.

Un sistema RAID, in pratica, è un cluster di più hard disk collegati in modo da ottenere una singola partizione logica. In base alle esigenze, il RAID permette di incrementare le performance di lettura e scrittura dei dati oppure di migliorare la sicurezza delle informazioni.

La tecnologia RAID supporta l'uso di due o più dischi in diverse configurazioni allo scopo di ottenere migliori performance, sicurezza e capacità.

Sono state create numerose configurazioni diverse, che sono indicate come livelli. Originariamente i livelli RAID arrivavano fino a cinque, ma si sono poi evoluti in molte altre variazioni, come numerosi livelli annidati o proprietari.

RAID 0, RAID 1, RAID 5, RAID 10: cosa indicano i livelli RAID? I numeri si riferiscono semplicemente alle diverse configurazioni RAID. Dato che tutti i sistemi RAID memorizzano i dati efficacemente, la scelta del sistema si baserà sulle specifiche esigenza personali. RAID 1, per esempio, soddisfa il bisogno di prestazioni e affidabilità. RAID 5 è una buona opzione se si cercano prestazioni elevate e un'alta tolleranza ai guasti.

 
Sistema RAID

Panoramica del sistema RAID

RAID è un termine utilizzato per indicare schemi di archiviazione dei dati che dividono e duplicano i dati tra diverse unità disco. Il RAID è stato progettato con due obiettivi principali: aumentare la sicurezza dei dati e le prestazioni I/O (input/output).

Un RAID aggrega fisicamente gli hard disk in una singola unità logica, utilizzando speciali soluzioni hardware e software. Esistono diverse soluzioni hardware, da quelle integrate sulla scheda madre a quelle che utilizzano schede dedicate, fino a sistema server NAS o SAN. Grazie a questi setup il tipo di hardware e software del RAID è indifferente per il sistema operativo.

Ci sono tre concetti chiave nei RAID:

  • il mirroring, cioè la copia esatta dei dati su più dischi
  • lo striping, la suddivisione dei dati in sezioni distribuite su più di un disco
  • la correzione degli errori, che permette di memorizzare dati ridondati per rilevare eventuali errori e correggerli (nota come fault tolerance)

I diversi livelli di RAID utilizzano una o più di queste tecnologie, a seconda dei requisiti di sistema.

La tecnologia RAID è solitamente utilizzata per i server, ma può essere implementata anche per le workstation. Quest'ultimo caso è particolarmente diffuso nei computer che sfruttano intensamente la memoria, come quelli utilizzati per l'editing di video e audio.

 
 
Storia del sistema RAID

Storia del sistema RAID

L'idea della tecnologia RAID è nata all'Università della California, a Berkeley, dove David A. Patterson, Garth Gibson e Randy H. Katz collaboravano per produrre prototipi operativi di cinque livelli di sistemi di archiviazione RAID. Il risultato della loro ricerca ha costituito la base dei complessi sistemi di archiviazione RAID esistenti oggi. Oggi IBM detiene i diritti di proprietà intellettuale su RAID 5.

L'architettura del sistema di storage RAID era finalizzata a migliorare le prestazioni, il recupero, l'affidabilità e la scalabilità della capacità di storage. Il risultato è stato l'ideazione di un concetto unico di ridondanza, che offre la possibilità di recupero dei dati nel caso in cui un'unità del sistema dovesse guastarsi. Infatti, le schede controller del RAID hanno la capacità di continuare a leggere e scrivere dati anche se un disco è "offline".

 

I diversi tipi di RAID

Ontrack offre il recupero dei dati per le principali architetture RAID: livelli RAID 0, 00, 1, 10, 1E, 1E0, 2, 3, 4, 5, 50, 5E, 5EE, 6 e 60. Operiamo anche su un gran numero di array RAID proprietari.

Lo sviluppo continuo delle nostre soluzioni software ci permettono di offrire le tecniche più evolute per ottenere il miglior recupero possibile dei dati. Inoltre, il team di Ricerca e Sviluppo assiste i nostri ingegneri nel ripristino delle informazioni nelle circostanze in cui devono occuparsi di interventi su array RAID proprietari atipici, creando strumenti specifici appositamente per il singolo caso.

I maggiori fornitori di RAID come HP, Dell, Adaptec, IBM, Intel, Promise, EMC, NetApp e LSI Logic raccomandano i nostri servizi.

La configurazione del RAID, insieme al numero dei dischi utilizzati, ne determina il tipo. Abbiamo già detto che RAID sta per Redundant Array of Independent Disks e che è una soluzione di storage ideata per distribuire i dati su più dischi singoli che insieme formano un sistema. Oltre ad essere una soluzione dal costo contenuto, questa tecnologia offre alti livelli di performance e sicurezza dei dati, dato che il RAID ha una elevata tolleranza ai guasti.

Oggi esistono circa 20 tipologie di RAID, se non di più, incluse le configurazioni considerate obsolete, come il RAID 2. Di tutte queste configurazioni, le più comuni sono RAID 0, RAID 1, RAID 10, RAID 2, RAID 3 e 4, RAID 5 o RAID 6.

Il RAID 0 è un sistema che utilizza almeno due dischi fissi e offre una elevata velocità di lettura dei dati. Il RAID 1 utilizza solo due dischi e duplica i dati in scrittura. Se uno dei dischi dovesse guastarsi, sarà possibile trovare i dati sull’altro. Per beneficiare delle performance del RAID 0 e della sicurezza offerta dal RAID 1, è stato realizzato il RAID 5. Con una efficace distribuzione deelle informazioni digitali, il RAID 5 unisce velocità e fault-tolerance (tolleranza ai guasti). Il RAID 6 ha gli stessi vantaggi del RAID 5, ma con il vantaggio di tollerare due guasti alle unità anziché uno.

 

RAID 0
Il RAID 0 è la configurazione classica di data striping, in cui i dati vengono scritti su tutte le unità del sistema, offrendo un accesso ai dati più rapido. Tuttavia, le prestazioni elevate comportano rischi per l’affidabilità del sistema: se uno o più dischi dovessero danneggiarsi, si rischia di andare incontro a una seria perdita di dati.
 
Prendiamo come esempio una situazione di recupero dei dati: è stato creato un file che occupa i blocchi dati 1 – 4, se il disco 2 dovesse danneggiarsi, la seconda stripe andrebbe persa e l’intero file sarebbe corrotto. Se un disco dovesse andare in fault la dimensione massima di un file funzionante sarebbe minore della dimensione dei blocchi rimanenti.
 
RAID 1
Questo livello RAID sfrutta il mirroring: i dati del disco primario sono duplicati esattamente sul secondo disco del sistema. Questo RAID non offre particolari vantaggi a livello di prestazioni, ma se un disco dovesse guastarsi, avrai una copia esatta dei tuoi file sull'altro.
 

RAID 2

 

RAID 2 impiega lo striping dei dati a livello di bit (invece che di blocco) con un disco di parità dedicato. Questo livello utilizza i codici di rilevamento degli errori di Hamming ed è destinato all'uso su unità che non dispongono di un rilevamento degli errori incorporato. Il RAID 2 al giorno d'oggi è considerato un sistema obsoleto.

 

RAID 3 and 4

 

I RAID 3 e 4 si servono entrambi di striping con unità di parity dedicata. La differenza trai due è che il RAID 3 esegue lo stripe a livello di byte, mentre il RAID 4 a livello di blocchi.

Il RAID 3 è utilizzato raramente al giorno d'oggi a causa delle scarse prestazioni dello striping a livello di byte; il RAID 4 ha performance migliori grazie allo striping a livello di blocchi, ma la velocità di scrittura è penalizzata, poiché la parity deve essere aggiornata ad ogni processo di scrittura.

 

RAID 5
Il livello RAID 5 è generalmente considerato come il miglior compromesso tra tolleranza ai guasti (fault-tolerance), velocità e costo. Il sistema suddivide (striping) i dati allo stesso modo di un RAID 0, ma in più distribuisce i dati di parità su tutti gli hard disk che lo compongono. Ogni fornitore ha il proprio modo specifico di distribuzione delle informazioni di parity sui dischi, ma sarà quasi sempre uno di questi quattro modi: asimmetrico sinistro, simmetrico sinistro, asimmetrico destro e simmetrico destro.

La direzione della parità è semplice da individuare, come si vede si "muove" sia a destra che a sinistra. Nei RAID asimmetrici i data stripe ignorano la parity, la saltano fino a raggiungere il successivo spazio disponibile. I RAID simmetrici gestiscono i data striping in modo un po' più complesso, una volta che i dati incontrano un blocco di parity, essi si muovono di traverso e in basso fino al seguente stripe set.
 
RAID 6
Il sistema RAID 6 è una estensione del RAID 5: esegue la medesima distribuzione di dati e adotta una suddivisione di parity simile, ma genera un blocco dati addizionale ad ogni stripe. In questo modo anche se due dischi dovessero guastarsi simultaneamente il RAID non subirebbe la perdita dei dati. Nei RAID più piccoli, l'eventualità che due hard disk si guastino contemporaneamente è ridotta, ma all'aumentare delle dimensioni dell'array RAID aumenta la possibilità di eventuali guasti.

Per quanto riguarda le performance, esse sono molto simili a quelle del RAID 5: la velocità di scrittura è elevata, perché i dati e i blocchi di parity possono essere scritti su tutti i dischi, ma l'accesso in lettura è lento a causa del ritardo generato dal salto di due serie di parity.
 
RAID 0+1 and 1+0
Per migliorare le prestazioni e/o ottenere ridondanza aggiuntiva, i livelli RAID standard possono essere combinati per creare livelli RAID ibridi o annidati. I RAID che offrono ridondanza sono in genere abbinati con i RAID 0 per aumentare le performance.

Il vantaggio di questa configurazione è che quando una unità si guasta in uno degli array di livello 0, i dati persi possono essere trasferiti dall’altro array. Comunque, l'aggiunta di un hard disk extra ad uno dei RAID 0 richiede necessariamente l'aggiunto di uno stesso hard disk sull'altro sistema RAID 0, per garantire la simmetria del sistema.

Lo svantaggio, d’altra parte, è che questo sistema non può essere ripristinato da due guasti simultanei, se i guasti avvengono nella stessa data stripe. Nel diagramma, se le unità 1 e 5 si guastano, il RAID può essere ripristinato, ma il guasto delle unità 1 e 4 comporterebbe la perdita dei dati.
 
RAID 10
Il RAID 10 è configurato in modo che il RAID 0 sia suddiviso tra due array RAID 1.

Il grande vantaggio del RAID 10 è dato dalla possibilità che il sistema possa perdere un disco da ciascun array RAID 1 senza subire la perdita dei dati. Tuttavia, se l’unità danneggiata non viene sostituita, la singola unità funzionante dell’array diventa il punto critico del sistema intero: se questo disco, che svolge tutte le operazioni, dovesse guastarsi, tutti i dati dell’array andranno persi.

La tecnica di nesting può essere utilizzata anche per altri livelli RAID, di solito RAID 5, ma può essere applicata anche a livelli come 3 e 6, producendo ulteriori nuovi livelli come 50, 51, 60, 61, 30 e 03.
 

RAID 50

 

RAID 50, indicato anche come RAID 5+0, abbina lo striping diretto a livello di blocco alla base del sistema RAID 0 con la parity distribuita della configurazione RAID 5. Come un array RAID 0 con striping su elementi RAID 5, la configurazione RAID 50 minima richiede almeno sei dischi. Un'unità di ciascuno dei set RAID 5 può guastarsi senza causare perdita di dati; ad esempio, una configurazione RAID 50 che include tre rami RAID 5 può tollerare al massimo tre potenziali guasti simultanei dei drive (ma solo uno per ramo del RAID 5). Poiché l'affidabilità del sistema dipende dalla velocità di sostituzione dell'unità guasta per consentire la ricostruzione dell'array, è comune includere hot spare che possono iniziare immediatamente la ricostruzione dell'array in caso di guasto.

 

RAID 51

 

Il RAID 51 è un tipo di livello RAID nidificato che fornisce mirroring basato su RAID 1 su ogni array RAID 5, oltre alle informazione di parity. Questa configurazione viene generalmente creata utilizzando tecniche RAID basate su software e hardware, in cui il mirroring del RAID 1 viene implementato attraverso un sistema operativo sull'array RAID 5 basato su hardware. Il RAID 51 è stato progettato specificamente per migliorare la disponibilità di backup e le capacità di tolleranza ai guasti. Il RAID 51 è considerato un ramo di parity di dischi in mirroring, per cui RAID 5 è seguito da RAID 1. Può rimanere operativo o evitare la perdita di dati anche dopo aver perso quattro dei sei dischi minimi configurati.

 

 

 


RAID: glossario e termini più diffusi

RAID: acronimo di "Redundant Array of Independent Disk". È una tecnologia che supporta l'utilizzo di 2 o più hard disk in varie configurazioni, allo scopo di ottenere maggiori prestazioni, affidabilità e capacità mediante l'utilizzo di risorse disco consolidate e calcoli di parità.

Parity (parità): calcolo matematico che consente alle unità all'interno di un array RAID di guastarsi senza generare la perdita dei dati. Il modo più semplice per spiegarne il funzionamento è l'equazione: A + B = C. Puoi rimuovere una qualunque delle lettere e calcolarne il suo valore dalle due rimanenti. Ad esempio, se la lettera B viene rimossa, l'equazione sarà A +? = C. Il valore di B può essere ricavato spostando la A come segue: B = C - A. Questo è ovviamente un modo semplicistico di descrivere il funzionamento della parity. Per comprenderlo pienamente, è necessaria la conoscenza del codice binario e dell'espressione logica XOR.

Mirroring: duplicazione dei dati di 1 o più hard disk su almeno un altro disco fisico.

Striping: metodo di sezionamento con cui i dati e la parity vengono scritti e distribuiti su più dischi.

Blocco: spazio logico in cui sono scritti i dati su ogni disco, la quantità di spazio è impostata dal controller RAID e solitamente è compresa tra 16KB e 256KB. I dati riempiono lo spazio disponibile fino al raggiungimento del limite, per passare poi alla successiva unità e così via, fino all'ultima unità.

Simmetria sinistra/destra: in un RAID la simmetria controlla come i dati e la parità sono suddivisi tra le unità del sistema. Esistono quattro principali tipologie di simmetria e sono i fornitori di RAID a scegliere quale utilizzare. Alcune aziende creano simmetrie proprietarie in base alle proprie specifiche esigenze.

Hot Spare: disco di riserva che viene utilizzato in caso di guasto di una delle unità del sistema.

Degraded mode: quando un hard disk del sistema RAID diventa illeggibile, l'unità viene considerata danneggiata e viene eliminata dal RAID. I nuovi dati e la parity vengono quindi scritti nelle unità rimanenti all'interno del RAID. Se vengono richiesti dati dall'unità guasta, questi sono elaborati grazie alla parità sulle altre. Ciò “degrada” le prestazioni del RAID, da qui l’espressione modalità degradata.

Iscriviti

KLDiscovery Ontrack Srl, Via Marsala 34/A, Torre/A, 21013, Gallarate (VA), Italia (Mostra tutte le sedi)