Définition d’un système de stockage RAID
La définition du RAID tient dans le nom même du système. En effet, RAID signifie Redundant Array of Independent Disks, ce qui veut dire littéralement regroupement redondant de disques indépendants.
Il s’agit de mettre en grappe plusieurs disques durs pour en obtenir une partition logique unique. En clair, à partir de plusieurs disques durs physiques, on obtient un seul espace visible par le système d’exploitation. En fonction de l’objectif, le RAID permet d'accroître la performance d’accès et d’écriture des données ou améliorer la sécurité des informations.
Parmi les configurations RAID existantes, il y a le RAID logiciel qui est géré par le système d’exploitation compatible. C’est le moyen le plus abordable pour mettre en commun plusieurs unités de stockage, mais il est nécessaire de disposer d’une bonne ressource pour gérer les différents disques durs.
Il y a également les cartes mères qui acceptent un montage matériel primaire. En clair, la carte mère est capable de gérer les disques durs mis en commun. Enfin, il y a les contrôleurs RAID dédiés qui disposent souvent d’une mémoire cache et d’une mémoire dédiées. Le système dispose alors d’une partition logique unique, et il est tout à fait possible dans le cas d’un RAID un d’effectuer un hot swap ou remplacement à chaud.
Qu'est-ce qu'un système de stockage RAID ?
Concrètement, un RAID consiste à combiner plusieurs disques durs qui apparaissent comme un disque unique. Ce système garantit une meilleure performance du disque, mais pas seulement.
De par le fonctionnement du RAID qui consiste à dupliquer tout ou une partie des données - d’où l’utilisation du terme redondant dans sa définition - le RAID offre par ailleurs une meilleure résilience. Vos données sont mieux protégées car le RAID présente une meilleure tolérance aux pannes.
Une fois que vous avez compris ce que veut dire RAID, vous appréhenderez plus facilement les différents types de système RAID. Sur ce point justement, que veut dire RAID 0, RAID 1, RAID 5, RAID 10... ? À quoi correspondent exactement ces chiffres ? Tout simplement à la configuration du RAID. Le choix du système se fera essentiellement en fonction de vos besoins en sachant que tous les systèmes RAID permettent de stocker efficacement les données.
Le RAID 1 par exemple répond aux besoins de performance et de fiabilité. Le RAID 5 constitue un choix judicieux si vous recherchez à la fois la performance et une grande tolérance aux pannes.
Historique du système RAID
RAID est l'acronyme de Redundant Array of Inexpensive Disks (matrice redondante de disques indépendants). Le concept est né à l'université de Californie, à Berkeley, où David A. Patterson, Garth Gibson et Randy H. Katz collaboraient en vue de produire des prototypes opérationnels de cinq niveaux de systèmes de stockage RAID.
Le résultat de leurs recherches a formé la base des systèmes de stockage RAID complexes qui existent de nos jours. Aujourd'hui IBM détient les droits de propriété intellectuelle sur RAID 5.
La conception du système de stockage RAID visait notamment à améliorer les performances, la récupération, la fiabilité et l'évolutivité du stockage. Il en a résulté un concept unique de redondance offrant des possibilités de récupération de données dans le cas où un disque tomberait en panne dans le système. En fait, les cartes contrôleurs RAID ont alors acquis la capacité de continuer à lire et écrire des données même si un disque est "hors ligne".
Présentation du système RAID
Un certain nombre de configurations standards ont été élaborées et sont référencées en termes de niveaux. A l'origine, il y avait cinq niveaux de RAID mais depuis, beaucoup d'autres variantes ont vu le jour, notamment plusieurs niveaux imbriqués et de nombreux niveaux non-standards (le plus souvent propriétaires).
Un RAID combine des disques durs physiques en une seule unité logique à l'aide, soit d’un matériel spécial, soit d’un logiciel. Les solutions du RAID matériel peuvent prendre une variété de styles tels qu’une construction sur la carte mère, un ajout de cartes, ou encore à plus grande échelle les serveurs NAS ou SAN. Ainsi, le système d’exploitation considère chaque volume RAID comme un disque et n’a pas connaissance de ses constituants physiques. Les solutions de RAID logiciel sont, quant à elles, généralement mises en œuvre directement dans le système d'exploitation.
Il existe trois concepts clés dans le RAID : le "mirroring" (miroitage, en français) consiste à copier des données sur plusieurs disques, le volume agrégé par bandes (connu sous le nom de "striping" en anglais) qui autorise la division des données au travers d’au minimum deux disques et enfin, la correction d'erreur, là où les données redondantes sont stockées afin de détecter les problèmes et éventuellement les réparer (communément appelée la tolérance aux pannes). Les différents niveaux de RAID utilisent une ou plusieurs de ces techniques, en fonction de la configuration système requise.
RAID est traditionnellement utilisé sur les serveurs, mais peut être aussi utilisé sur les postes de travail. Ce dernier cas s’avère particulièrement vrai lors de stockages physiques sur des ordinateurs tels que ceux utilisés pour des montages vidéo et audio.
Le cœur du système de stockage RAID est la carte contrôleur. Cette carte est généralement une carte contrôleur de disque dur SCSI ( toutefois, les cartes contrôleurs RAID IDE se généralisent). Ses fonctions sont de :
- gérer les disques durs individuels,
- fournir une configuration de système logique,
- accomplir des opérations redondantes ou tolérantes aux pannes.
Le contrôleur RAID traduit et communique directement avec les disques durs. Certaines cartes contrôleurs s'accompagnent d'outils complémentaires pour intervenir spécifiquement sur les disques, tels qu'une fonction d'analyse de surface et un utilitaire de formatage de disque. Dans le cas des cartes basées sur SCSI, ces contrôleurs offrent des options supplémentaires pour la gestion des disques.
Configurations RAID
La configuration du système logique répartit les données par bandes sur l'ensemble des disques physiques. Cela permet d'avoir un débit de données équilibré sur l'ensemble des disques : au lieu d'avoir un disque qui fait tout le travail de lecture et d'écriture des données, tous les disques travaillent ensemble. Les données sont ainsi réparties sur l'ensemble des disques physiques.
Opérations redondantes ou tolérantes aux pannes
La redondance dans une configuration RAID 5 courante est le résultat de l'utilisation d'une fonction mathématique booléenne appelée "OU exclusif" (XOR). C'est ce qu'on qualifie communément de parité. La fonction XOR est un processus binaire logique. Le mieux est de considérer la parité comme une combinaison des blocs de données de l'autre disque. Chaque octet qui est écrit dans un bloc de données est calculé par rapport aux autres blocs de données. La parité ainsi obtenue est écrite dans le bloc de parité pour cette bande donnée. Si cette fonction est tellement unique, c'est parce que le calcul fonctionnera toujours, quel que soit le bloc de données manquant. Toutefois, les limitations de RAID 5 sont qu'un seul bloc de données peut être manquant : le calcul ne fonctionnera pas s'il manque deux blocs. Dans l'environnement de travail, cela signifie qu'un seul disque peut tomber en panne. La configuration RAID 5 n'offrira pas une redondance adéquate si deux disques ou plus tombent en panne.
Comme indiqué précédemment, la carte contrôleur répartit les données par bandes et exécute également la fonction XOR sur ces données. La quantité de calculs logiques qu'accomplit le contrôleur à chaque seconde est impressionnante. Les contrôleurs RAID actuels sont des systèmes matériels très sophistiqués, incluant des processeurs et des bancs de mémoire SDRAM spécialement conçus pour offrir performances et redondance.
La récupération de données RAID
Bien que les systèmes de stockage RAID soient conçus pour résister aux pannes, certaines défaillances matérielles ou autres, peuvent rendre vos données inaccessibles.
Si votre système rencontre de tels problèmes avec sa matrice RAID, Ontrack Data Recovery maîtrise les procédures et les techniques de récupération de données RAID.
Nos ingénieurs s'accordent à dire que la récupération de matrices RAID est l'un des aspects techniques les plus difficiles de la récupération de données. L'évaluation d'une récupération de système RAID est en fait la combinaison de deux étapes très importantes :
-
La première, et la plus longue, est le ré-assemblage de la matrice. Lorsque les ingénieurs d'Ontrack Data Recovery ré-assemblent le système logique, ils ont mené au préalable des recherches approfondies sur la façon dont les données sont organisées sur l'ensemble des disques. Ils connaissent ainsi l'ordre des disques et la disposition des blocs de données et des blocs de parité. Cet investissement en temps est nécessaire pour déterminer la configuration d'origine et obtenir une récupération de qualité,
-
La seconde étape consiste à travailler sur le système de fichiers logique. Les systèmes actuels de fichiers journaux d'entreprise sont extrêmement complexes. Si la matrice RAID est en panne, il y aura des milliers d'erreurs au sein du système de fichiers. Les ingénieurs d'Ontrack Data Recovery vérifient et confirment que la matrice est structurée correctement avant de copier la moindre donnée. Cette étape supplémentaire garantit une récupération de qualité.