RAID 5 : une technologie performante pour l'intégrité des données

Written By: Ontrack

Date Published: 6 novembre 2023

RAID 5 : une technologie performante pour l'intégrité des données

Développé au début des années 80, le RAID 5 est la configuration la plus courante. Elle offre un bon compromis entre tolérance aux pannes et performances. Une matrice RAID 5 nécessite au moins trois disques et offre des vitesses de lecture accrues, mais aucune amélioration des performances d'écriture. Ce niveau de RAID peut tolérer la défaillance d'un seul disque.

Qu'est-ce qu'une configuration RAID 5 ?

Une matrice RAID 5 contient au moins 3 disques et utilise le concept de redondance, ou de parité, pour protéger les données sans sacrifier les performances

À l'instar d'une matrice RAID 0 qui répartit les données sur plusieurs disques pour améliorer les performances, le RAID 5 répartit les données, mais ajoute une bande supplémentaire de données, appelée parité. Les données contenues dans la bande de parité, dans la plupart des configurations RAID 5, sont un XOR ("ou" exclusif) des données des autres bandes (striping). Cela rend le RAID 5 moins cher à mettre en œuvre qu'un RAID 10, car un seul espace de disque est alloué à la parité et permet une plus grande flexibilité, et des tailles de volume plus importantes qu'un RAID 1.

RAID 5 fonctionnel

Dans l'exemple ci-dessus, la parité trouvée sur le lecteur 4 pour la première bande est le XOR des données des bandes nommées Data1, Data 2 et Data 3. La parité trouvée dans la deuxième bande sur le lecteur 3 est le XOR exclusif des bandes de données nommées Data 4, Data 5 et Data 6.

La parité dans une matrice RAID 5

Le fait d'avoir un bloc de redondance, ou de parité, dans chaque bande de données permet au système de se reconstruire en cas de panne ou de mise hors ligne de l'un des disques.

Le contrôleur RAID ou le logiciel RAID peut pratiquement reconstruire tout segment de données manquant en utilisant la parité.

RAID 5 avec un disque défaillant

Dans l'exemple ci-dessus, nous voyons qu'un disque est en panne. Lors de la perte d'un disque, la matrice passe en mode dégradé. En mode dégradé, le contrôleur RAID combinera les bandes de données avec la parité nécessaire pour présenter de bonnes données au système d'exploitation. Dans notre exemple, le contrôleur combinera les données 1, les données 3 et la parité pour la première bande pour remplacer les données manquantes dans les données 2. Dans la deuxième bande, les données 4, les données 6 et la parité sont utilisées pour remplacer les données 5. Dans la troisième bande, aucune parité n'est nécessaire, car tous les lecteurs de données sont présents.

Comment fonctionne un Hot Spare dans une matrice RAID 5 ?

Un Hot Spare (ou disque de remplacement à chaud) est un disque supplémentaire qui peut être ajouté à une matrice RAID 5 pour permettre la récupération rapide d'un disque défaillant.

RAID 5 fonctionnel avec Hot Spare

Dans l'exemple ci-dessus, nous voyons une matrice RAID 5 saine avec le Hot Spare ajouté. Notez que l'espace actif ne contient aucune donnée jusqu'à ce qu'une panne se produise et que le lecteur soit nécessaire.

Si un Hot Spare est disponible sur le système, le contrôleur commencera automatiquement à reconstruire les données manquantes du disque défaillant en cas de panne.

RAID 5 avec un disque défaillant et Hot Spare

Dans l'exemple ci-dessus, le lecteur 2 est tombé en panne. Le système a utilisé le Hot Spare et y a reconstruit toutes les données manquantes du disque 2.

Lorsqu'un disque tombe en panne, le temps presse pour le reconstruire. Le fonctionnement en mode dégradé exerce une pression supplémentaire sur les disques restants et peut entraîner des pannes supplémentaires si elles ne sont pas corrigées rapidement. Avoir un ou plusieurs disques de secours disponibles permet des temps de récupération plus rapides.

Est-il possible de récupérer des données sur un RAID 5 ?

Il est tout à fait possible de récupérer des données à partir d'une matrice RAID 5 défaillante. Et bien que cela puisse être une opération complexe et difficile, la récupération de données RAID 5 se termine généralement avec succès.

Il existe plusieurs raisons à la perte de données et l'effort de récupération pour chacune d'entre elles est différent. En voici quelques exemples :

Récupération de données avec un seul disque en panne

RAID 5 avec un disque défaillant

Si un disque tombe en panne dans une matrice RAID 5, la parité peut être utilisée pour reconstruire les données manquantes. Dans ce scénario, Ontrack est généralement capable de récupérer 100 % des données. Dès réception d'une matrice non fonctionnelle, les disques de la matrice sont imagés en salle blanche. L'ensemble est ensuite virtuellement reconstruit à l'aide de ces images. Une fois le RAID assemblé, le système de fichiers ou le volume est analysé à la recherche de corruption, virtuellement réparé et les données sont extraites. Le disque défaillant n'est souvent pas nécessaire, car toute bande de données manquante peut être reconstruite grâce à la parité.

Récupération de données avec plusieurs disques en panne

RAID 5 avec de multiples disques défaillants

Le processus est similaire à une panne de disque unique. Dès réception d'une matrice non fonctionnelle, les disques de la matrice sont imagés dans la salle blanche. Il est important d'obtenir autant d'images que possible de chacun des disques défaillants, car cela permet la récupération de plus de données.

La matrice est ensuite virtuellement reconstruite à l'aide de ces images. Dans l'exemple ci-dessus, les données 2, les données 3 et la parité de la première bande sont utilisées pour reconstruire les données 1. La parité n'est pas nécessaire dans la deuxième bande, car tous les blocs de données sont présents. Dans la troisième bande, les données 7, la parité et les données 8 sont combinées pour remplacer les données 9.

Une fois la matrice RAID virtuellement réassemblée, le système de fichiers ou le volume est analysé à la recherche de corruption. Outre la corruption du système de fichiers, les ingénieurs recherchent également des données non cohérentes ou obsolètes. Cela se produit lorsqu'il y a un intervalle de temps entre les pannes de disque et que l'un des disques est dégradé. Les ingénieurs en récupération de données doivent être expérimentés pour reconnaître ce type de dommage afin de pouvoir réparer virtuellement le volume et extraire de bonnes données de fichiers.

Newsletter

KLDiscovery Ontrack Sarl, 2, impasse de la Noisette, 91370 Verrières-le-Buisson, France (voir tous nos bureaux)