RAID, abréviation de Redundant Array of Independent Disks, est un ensemble de lecteurs de disques durs ou SSD indépendants capables de fournir une redondance aux données. Les systèmes RAID sont principalement utilisés en entreprise, où ils représentent un système de stockage répandu dans les environnements de serveurs.
Avec la baisse continue des prix, il est désormais assez courant de trouver également des configurations RAID chez des particuliers. Ces systèmes ne sont pas comparables aux systèmes RAID professionnels, ils sont souvent utilisés dans des NAS (Network Area Storage) bas de gamme connectés dans un réseau domestique pour stocker et partager des vidéos, des photos, de la musique et autres contenus avec plusieurs appareils.
L'utilisation professionnelle n’a absolument rien à voir. Les architectures de stockage du système RAID de l'entreprise exécutent des tâches, souvent cruciales, et leur efficacité et temps de fonctionnement sont d'une importance capitale. Ces systèmes RAID supportent les environnements virtuels (par exemple, VMware, Microsoft Hyper-v, etc.), les bases de données (par exemple, Microsoft SQL et Oracle), les systèmes de courrier électronique comme Microsoft Exchange Server et toutes les applications nécessitant performance, fiabilité et évolutivité.
Dans ces situations, la défaillance d'un système RAID couplée à une perte de données constitue un véritable désastre qu'il vaut mieux éviter.
Faire confiance c'est bien, ne pas faire confiance c'est mieux !
Les systèmes RAID sont plus fiables que les lecteurs de disques durs ou les SSD individuels. Cette affirmation est exacte car le fait qu’ils utilisent plusieurs disques et fournissent une redondance leur permet de tolérer la défaillance d'un lecteur de la matrice. Si nécessaire, la reconstruction des informations peut être effectuée à l'aide de la parité calculée et stockée durant les opérations d'écriture traditionnelles.
Étant donné que faire confiance c'est bien mais, des fois, ne pas faire confiance c'est mieux, vous trouverez ci-dessous une série de suggestions commentées par nos experts pour vous aider à travailler plus efficacement et dans de meilleures conditions avec votre système RAID.
13 recommandations pour travailler tranquillement sur un serveur RAID
- Il est inexact de dire que les systèmes RAID ne perdent pas de données : Les systèmes RAID limitent le risque de perte de données mais n'éliminent pas le problème complètement : aucun système de stockage n’est à l’abri d’une perte de données,
- Faites attention, les systèmes RAID ne sont pas toujours « redondants » ! Certaines configurations RAID n’ont aucune tolérance aux pannes, RAID 0 n'offre pas de redondance ou de calcul de parité. Les données sont généralement séparées sur deux disques et la défaillance d'un disque provoque une perte de données,
- Le système RAID fonctionne même lorsqu’un lecteur tombe en panne… Vrai. En général, sauf dans quelques rares cas, un système RAID fonctionne même lorsqu’un disque tombe en panne. C'est, par exemple, le cas du système RAID 5, l'une des configurations les plus courantes. Quoi qu'il en soit, il est conseillé de ne pas sous-estimer la défaillance d'un disque dans un RAID 5. Remplacez le disque défaillant aussi vite que possible car la défaillance d'une deuxième unité provoquera une perte des données,
- ... mais il ne supporte pas la défaillance de deux disques : La configuration RAID 5 ne tolère pas la défaillance de deux disques. La tolérance à la panne de deux disques est supportée par le système RAID 6 qui fonctionne à l'aide d'une double parité. Au sein d'environnements nécessitant une tolérance aux pannes élevée, il est préférable de choisir le système RAID 6. Si la performance représente l’objectif principal, le système RAID 5 peut offrir un bon compromis entre sécurité et performance. Les opérations d’écriture se font plus rapidement sur un système RAID 5 car le calcul de la parité est « simple » comparé au calcul sur le système RAID 6,
- Remplacer un disque défaillant : Très souvent, le système RAID est composé de lecteurs de disques durs ou de SSD du même fabricant, du même type et du même lot. Lorsqu'un disque tombe en panne, il est possible qu'une deuxième unité cesse de fonctionner après une courte période. Pour remplacer un lecteur défaillant, il est suggéré d'utiliser un lecteur identique pour que toutes les unités du RAID aient les mêmes caractéristiques, non seulement en termes de capacités mais aussi en termes de performance. Ne jamais remplacer un lecteur par un lecteur qui a déjà fait partie d'un système RAID !
- Reconstruire oui, reconstruire non : L'opération de reconstruction, comme son nom l’indique, permet de reconstruire la matrice du système RAID en cas de problème de lecteur. De nombreux lecteurs de disques proposent une « connexion à chaud » qui vous permet d'enlever et remplacer le lecteur de disque dur sans avoir besoin d'arrêter le système et donc d’interrompre le service. L’opération de reconstruction est souvent longue mais pourrait résoudre le problème en reconstruisant le système RAID après le remplacement du disque défaillant par un nouveau disque. Cependant, si un élément tombe en panne durant la procédure, l'opération de reconstruction entraînera des dégâts supplémentaires. L'exécution d'une reconstruction n'est pas sans risques et ne devrait être effectuée que si vous pouvez vous appuyer sur une sauvegarde informatique à jour et en état de marche.
- N'oubliez pas de numéroter les lecteurs : Les lecteurs d'un système RAID ont un emplacement spécifique dans la matrice. Numérotez les lecteurs en fonction de leur position dans la chaîne du système RAID pour pouvoir reconstruire l'emplacement physique de chaque unité si nécessaire ou si vous devez envoyer les lecteurs à un fournisseur de récupération de données. Aujourd’hui, le lecteur individuel RAID possède une zone réservée avec des informations RAID cachées. Ainsi, numéroter le lecteur pourrait ne pas être une nécessité. La fente dans laquelle est inséré le lecteur a peu d'importance. Même le fait de sortir les lecteurs de manière aléatoire et de les remettre dans un ordre différent ne devrait pas endommager l'installation si les informations du système RAID sont toujours bonnes (mais malheureusement, dans de nombreux cas, la zone est endommagée ou écrasée),
- N'utilisez pas l'utilitaire de réparation en cas de corruption de données sur le système RAID : Des problèmes liés au contrôleur ou une panne de courant peuvent altérer le système de fichiers ou rendre les données inaccessibles. Ne lancez pas les utilitaires pour réparer le volume car ils effectuent des opérations d'écriture et pourraient davantage endommager la structure logique des données et rendre toute récupération de données plus complexe,
- Prenez garde aux « options par défaut » : La plupart des utilisateurs se servent du système configuré avec des paramètres standards. Cependant, certains spécialistes peuvent changer ces options pour rendre le système RAID plus sécurisé qu'à l'origine, c'est-à-dire en mettant en place RAID 6. En cas d'erreurs, les utilisateurs ont généralement tendance à essayer différentes options, y compris la restauration d'options par défaut. Cette opération démarrera une installation du système RAID 5 qui écrasera le système RAID 6, ce qui entraînera une perte de données conséquente,
- Arrêtez le système immédiatement ! Dans le cas de données perdues à cause d'une suppression accidentelle, appuyez immédiatement sur l’interrupteur « Arrêt » de votre système. Cette méthode « non conventionnelle » est nécessaire car la fonction d'arrêt classique pourrait écraser des zones du disque où se trouvent les informations qui doivent être récupérées. Si un lecteur de disque dur fait des bruits inhabituels, la procédure est la même. Dans ce cas, l'objectif est de réduire l'étendu des dégâts physiques (typiquement un écrasement de tête où la tête creuse des sillons sur le disque en supprimant la surface magnétique où les données sont stockées),
- Sauvegarde... s'il vous plait : Si vous avez l'intention d'effectuer des changements sur le système RAID, abstenez-vous si vous n'êtes pas sûr d'avoir une sauvegarde informatique à jour et en état de marche. Travailler ou modifier une configuration RAID peut accidentellement provoquer une perte de données, qui peut être résolue en restaurant la sauvegarde informatique,
- Comment restaurer une sauvegarde informatique : Évitez de restaurer la sauvegarde informatique directement sur le système RAID où les données ont été perdues. Si la sauvegarde informatique n'est pas à jour ou en état de marche ou que la procédure ne fonctionne pas, cela entraînera une opération d'écrasement de la seule source (le système RAID d'origine) qui peut être utilisée pour récupérer les données,
- Assistance technique du fabricant du matériel : Dans l’éventualité où votre système RAID tomberait en panne, il est normal d'appeler l'assistance technique offerte par le fabricant du matériel, en particulier sur des systèmes avancés et complexes. Souvenez-vous que l'objectif de l'assistance technique est de remettre le système RAID en état de marche, pas de récupérer les données. Les techniciens concernés remplaceront le(s) lecteur(s) défaillant(s) et configureront le système pour qu'il marche à nouveau. Et vos données ? Parlez à l'assistance technique du fabricant en lui expliquant que vous avez besoin de discuter avec un fournisseur de récupération de données. Le risque est de vous retrouver avec un système qui fonctionne parfaitement, mais qu'il soit impossible de récupérer les données qui y sont stockées.
Des données RAID ont disparu, que faire ?
Si malgré nos conseils vous veniez à perdre des données sur votre système RAID, sachez que la complexité d'une récupération de données RAID repose sur 3 facteurs :
- Le système RAID est constitué de plusieurs disques où les données sont écrites/organisées d'une manière complètement différente de celle d’un lecteur de disque dur individuel,
- Dans la plupart des cas, les données se trouvant sur un système RAID ont des structures logiques complexes, pensez par exemple aux appareils virtuels ou aux bases de données,
- Un système RAID professionnel utilise une architecture matérielle complexe et avancée et souvent du matériel breveté.
Il est possible de retrouver ses données mais le choix du prestataire est absolument essentiel pour qu'une récupération de données réussisse. Sélectionnez une entreprise de récupération de données très connue sur le marché et pouvant vous offrir l'expertise dont vous avez besoin pour gérer ces récupérations RAID complexes.
Dans de nombreux cas, il est nécessaire de développer des outils spécifiques ou d'adapter les outils existants au scénario actuel. Votre fournisseur de récupération de données devrait pouvoir développer dans son centre de recherches tout ce qui est nécessaire pour s'occuper de votre cas de la meilleure des manières.
Enfin, votre prestataire de récupération de données doit vous offrir des services de récupération de données 24h/24, 7j/7 étant donné que les systèmes RAID sont le plus souvent absolument cruciaux pour votre entreprise et que vous avez besoin d'être à nouveau sur pieds aussi rapidement que possible pour réduire le coût du temps d'arrêt.