Nel corso degli anni, i sistemi di archiviazione sono diventati parte integrante dei sistemi informatici. Introdotto più di 20 anni fa, il sistema di archiviazione RAID ha seguito questa evoluzione ed è ora un'ottima soluzione di archiviazione per sistemi aziendali.
Il RAID (Redundant Array of Independent Disk) ha rivoluzionato la tecnologia di archiviazione dei dati aziendali grazie alla soluzione della ridondanza (dalle configurazioni RAID 1 e successive versioni), che riduce notevolmente i periodi di inattività causati da guasti agli hard disk.
Sfortunatamente, però, quella RAID non è una tecnologia perfetta e, di conseguenza, si possono sempre verificare casi di perdita dei dati.
Definizione di Sistema di storage RAID
La definizione di RAID risiede nel nome stesso del sistema. Infatti, RAID sta per "Redundant Array of Independent Disks", che letteralmente significa "insieme ridondante di dischi indipendenti". In pratica si tratta di un cluster di più hard disk collegati in modo da ottenere una singola partizione logica. In base alle esigenze, il RAID permette di incrementare le perfomance di lettura e scrittura dei dati oppure di migliorare la sicurezza delle informazioni.
La tecnologia RAID supporta l'uso di due o più dischi in diverse configurazioni allo scopo di ottenere migliori performance, sicurezza e capacità.
Sono state create numerose configurazioni diverse, che sono indicate come livelli. Originariamente si ricordano cinque livelli RAID, ma che si sono poi evoluti in molte altre variazioni, come numerosi livelli annidati o proprietari.
RAID 0, RAID 1, RAID 5, RAID 10: cosa si indicano i livelli RAID? I numeri si riferiscono semplicemente alle diverse configurazioni RAID. Dato che tutti i sistemi RAID memorizzano i dati efficacemente, la scelta del sistema si baserà sulle specifiche esigenza personali.
Storia del sistema RAID
RAID è l'acronimo di Redundant Array of Inexpensive Disks (nella prima definizione). L'idea è nata all'Università della California, a Berkeley, dove David A. Patterson, Garth Gibson e Randy H. Katz collaboravano per produrre prototipi operativi di cinque livelli di sistemi di archiviazione RAID. Il risultato della loro ricerca ha costituito la base dei complessi sistemi di archiviazione RAID esistenti oggi. Oggi IBM detiene i diritti di proprietà intellettuale su RAID 5.
L'architettura del sistema di storage RAID era finalizzato a migliorare le prestazioni, il recupero, l'affidabilità e la scalabilità della capacità di storage. Il risultato è stato l'ideazione di un concetto unico di ridondanza, che offre la possibilità di recupero dei dati nel caso in cui un'unità del sistema dovesse guastarsi. Infatti, le schede controller del RAID hanno la capacità di continuare a leggere e scrivere dati anche se un disco è "offline".
Panoramica del sistema RAID
RAID è un termine utilizzato per indicare schemi di archiviazione dei dati che dividono e duplicano i dati tra diverse unità disco. Il RAID è stato progettato con due obiettivi principali: aumentare la sicurezza dei dati e le prestazioni I/O (input/output).
Un RAID aggrega fisicamente gli hard disk in una singola unità logica, utilizzando speciali soluzioni hardware e software. Esistono diverse soluzioni hardware, da quelle integrate sulla scheda madre a quelle che utilizzano schede dedicate, fino a sistema server NAS o SAN. Grazie a questi setup il tipo di hardware e software del RAID è indifferrente per il sistema operativo.
Ci sono tre concetti chiave nei RAID:
- il mirroring, cioè la copia esatta dei dati su più dischi
- lo striping, la suddivisione dei dati in sezioni distribuite su più di un disco
- la correzione degli errori, che permette di memorizzare dati ridondati per rilevare eventuali errori e correggerli (nota come fault tolerance).
I diversi livelli di RAID utilizzano uno o più di queste tecnologie, a seconda dei requisiti di sistema.
La tecnologia RAID è solitamente utilizzati per i server, ma può essere implementata per le workstation. Quest'ultimo caso è particolarmente diffuso nei computer che sfruttano intensamente la memoria, come quelli utilizzati per l'editing di video e audio.
Configurazioni RAID
La configurazione logica del sistema divide i dati in sezioni che vengono suddivise equamente su tutti i dischi fisici del sistema. Questo permette di aver una distribuzione bilanciata su tutti i dischi: invece di avere un disco che svolge tutte le operazioni di lettura e scrittura dei dati, tutti i dischi lavorano insieme.
Operazioni ridondanti o fault-tolerant
La ridondanza in una configurazione RAID 5 attuale è il risultato dell'uso di una funziona matematica booleana chiamata "Disgiunzione esclusiva" (XOR, dall'inglese eXlusive OR). Il risultato di questa funzione è quello a cui ci riferiamo normalmente con il termine "parity". La funzione XOR è un processo binario logico. È più semplice considerare la parity come una combinazione dei blocchi di dati dei vari dischi. Ogni byte che viene scritto su un blocco di parity è calcolato rispetto agli altri blocchi di dati. Questo calcolo funzionerà sempre, indipendentemente dalla mancanza di un blocco di dati. Tuttavia, il calcolo non funzionerà se dovessero mancare due blocchi. In pratica, solo un disco può guastarsi senza compromettere il funzionamento del sistema. La configurazione RAID 5 non offre una ridondanza adeguata se due o più dischi dovessero rompersi.
Come indicato in precedenza, la scheda di controllo (controller board) divide i dati in sezioni ed esegue anche la funzione XOR su tali dati. La quantità di calcoli logici eseguiti ogni secondo dalla scheda di controllo è impressionante. I controller RAID moderni sono sistemi hardware molto sofisticati, così come i processori SDRAM e i banchi di memoria progettati espressamente per offrire performance e ridondanza.
Sebbene i sistemi RAID siano progettati per essere fault-tolerant, guasti hardware o di altro tipo possono rendere inaccessibili i tuoi dati. Se il sistema dovesse riscontrare qualsiasi tipo di problema con il suo RAID array, Ontrack Data Recovery possiede l'esperienza, le procedure e le tecniche per recuperare i tuoi dati.
I nostri ingegneri concordano col fatto che il ripristino dei RAID array rappresenta una delle sfide tecniche più difficili del recupero dei dati. La valutazione accurata di un recupero dati da sistema RAID è in realtà la combinazione di due step molto importanti:
-
Il primo e più lungo passaggio è la ricostruzione della matrice. Quando gli ingegneri Ontrack Data Recovery riassemblano il sistema logico, eseguono una ricerca approfondita su come i dati sono organizzati su tutti i dischi. Definisco così l'ordine dei dischi e la disposizione dei blocchi di dati e dei blocchi di parity. Questo processo è un aspetto fondamentale per determinare la configurazione originale e offrire un recupero dati di qualità.
-
Il secondo step consiste nell'operare sul file system logico. I log file system aziendali sono estremamente complessi. Se il RAID array non funziona, ci saranno migliaia di errori nel file system. I tecnici di Ontrack Data Recovery verificheranno che la matrice sia strutturata correttamente prima di copiare qualsiasi dato. Questo passaggio aggiuntivo fa la differenza e garantisce un recupero dati di qualità.