Les systèmes de stockage d'entreprise modernes sont plus que jamais des créations hautement complexes tant dans l'architecture informatique que dans la structure des données. Il y a quelques années encore, ces systèmes reposaient essentiellement sur la technologie RAID (Redundant Array of Independent (or inexpensive) Disk) mais ce temps est désormais révolu. Bien que le RAID soit encore utilisé dans les systèmes de stockage moderne, la plupart des systèmes haut de gamme utilisent maintenant d’autres technologies telles que la virtualisation, la déduplication de données, les conteneurs ou le concept de pool de stockage combiné.
Dès lors que l’on combine la virtualisation et la distribution des données sur différents disques durs à l'intérieur même du système de stockage, il y a au moins une couche de structure de données supplémentaire à prendre en compte : la couche de virtualisation. Si une technologie unique est utilisée pour combiner l'ensemble des machines virtuelles dans une structure définie par logiciel, vous obtenez une autre couche. En fonction de la façon dont le fabricant a conçu son produit, les données sont stockées sur de nombreuses couches différentes qu’il faudra alors reconstruire en cas de perte de données. Pourtant, même si le processus de récupération de données devient de plus en plus difficile à cause de la complexité de ces nouvelles technologies, l’opération reste possible. Mais cela dépend bien évidemment de chaque cas particulier.
Cas 1 : Récupération d'un système VMware vSAN
Il existe de nombreux cas où les spécialistes de Ontrack ont réussi à récupérer des données d'un système de stockage haut de gamme avec plusieurs couches de données. L'un de ces cas concernait un système vSAN VMware, quasiment neuf, totalement crashé à cause d'une simple mémoire SSD, utilisée comme mémoire cache système. VMware propose pourtant depuis mars 2014 l'option vSAN pour les serveurs vSphere EXSi afin d'organiser et de gérer les stockages. Néanmoins, le système a planté quelques mois plus tard. Un tel système vSAN combine les applications ou les données sauvegardées dans des machines virtuelles dans un magasin de données sur le stockage partagé en cluster. Tous les ordinateurs hôtes connectés et leurs disques durs font partie de ce magasin de données commun. Cela signifie qu'en cas de panne matérielle ou de perte de données, les ingénieurs doivent gérer un niveau d'information supplémentaire. Ce système particulier comprenait 15 disques durs et 3 mémoires SSD, mais avec le plantage de ce SSD, trois ordinateurs hôtes / nœuds ont crashés et une perte temporaire de 4 grosses machines virtuelles s'est produite.
Pour récupérer et sauvegarder toutes les données manquantes du système de stockage défaillant, les ingénieurs de Ontrack ont dû développer de nouveaux outils logiciels pour trouver la description et les fichiers journaux nécessaires à l'identification et à l'assemblage des données. Les magasins de données fonctionnaient comme des conteneurs, alors les spécialistes ont d'abord eu besoin d'identifier les liens vers les machines virtuelles contenues pour ensuite les reconstruire. Grâce aux nouveaux outils, ils ont ainsi pu obtenir des informations sur la façon dont les machines virtuelles étaient enregistrées dans le magasin de données du vSAN et distribuées sur les disques durs concernés. Cela a permis de retrouver les fichiers logs nécessaires beaucoup plus rapidement, rendant le processus de récupération beaucoup plus facile. Grâce à ces outils, les spécialistes ont pu récupérer les machines virtuelles et toutes les données stockées sur le système vSAN.
Cas 2 : Récupération d'un système de stockage HP StorageWorks EVA 6000
Un autre cas démontre la difficulté de récupérer des données à partir d'un système de stockage haut de gamme très complexe et multicouches. Les ingénieurs de Ontrack Allemagne ont reçu en début d’année dernière un HP StorageWorks EVA (Enterprise Virtual Array) 6000 qui contenait des bases de données SQL très importantes ainsi que des informations sur les employés d’une société. Suite à une inondation, les données contenues sur le système de stockage n’étaient plus accessible.
Depuis que le système HP EVA a été entièrement virtualisé, il fonctionne avec des groupes de disques et des disques virtuels à la place des ensembles RAID normaux et des volumes de lecteurs logiques. Dans un HP EVA tous les disques physiques et leur contenu sont donc organisés en groupes de disques de manière aléatoire. Les disques logiques, appelés vDisks dans l’univers de la virtualisation EVA, sont distribués sur tous les disques durs installés. Dans ce cas précis, 80 disques durs contenaient 18 volumes RAID virtuels avec chacun des matrices VRAID 1 et VRAID 5.
Après que 25 disques durs du système de stockage aient été nettoyés et réparés en salle blanche par les ingénieurs afin de pouvoir accéder aux données, le travail de récupération de données logique a pu commencer. Pour avoir accès aux données contenues sur les disques durs endommagés les ingénieurs ont du non seulement découvrir comment le système de fichiers de données EVA a été structuré dans son ensemble, mais également effectuer le reverse engineering de tout le système.
Pour savoir exactement comment le système EVA est conçu, du matériel identique a été acheté. Il a ensuite été configuré avec différente configurations pour découvrir comment les structures de système de fichiers personnalisées EVA, qui contrôlent la façon dont les données sont distribuées sur les lecteurs, sont construites. Après avoir compris les RAID virtuels, la structure du système de fichiers et la manière dont les vDisks étaient mappés sur tous les disques, les ingénieurs ont dû reconstruire l'ensemble du système EVA avec tous les disques physiques. Étant donné que la récupération des données HP EVA se réalise au niveau des disques, les ingénieurs de Ontrack ont pratiquement assemblé tous les groupes et sous-groupes de disques puis reconstruit virtuellement les vDisks. Enfin, pour récupérer les données contenues dans les vDisks, l'équipe de recherche et de développement a dû créer des outils complètement nouveaux pour en extraire les données.
Après près de six semaines de travaux de développement, de ré ingénierie et de récupération, le projet s'est terminé avec succès. Grâce au développement de ces nouveaux outils, les spécialistes de la récupération de données ont pu récupérer quatre téraoctets de fichiers de base de données SQL sensibles, soit environ 90 % de la quantité totale de données perdues à cause de l’inondation.
Toujours possible de récupérer des données
Ces deux exemples montrent bien qu'il est possible de récupérer des données sur des systèmes de stockage s'appuyant sur différentes technologies, et donc avec de nombreuses couches de structures de données superposées auxquelles il faut accéder les unes après les autres pour, à la fin, récupérer les données réelles.
Le nombre de couches devant être reconstruites et accessibles dépend de la solution de stockage et de son architecture sous-jacente. Une chose est sûre, qu’un fabricant utilise un seul système de fichiers propriétaire ou mélange plusieurs technologies à l'intérieur de son propre système, il sera plus difficile pour les experts en récupération de données de savoir ce qui est cassé après qu’une panne et une perte de données se soit produite. Chaque système et chaque projet de récupération de données a donc ses propres particularités à surmonter. C'est pourquoi il est important de choisir, en cas de plantage d’un système de stockage haut de gamme, un prestataire de services de récupération de données expérimenté ayant les outils et le savoir-faire nécessaires pour pouvoir surmonter les difficultés de tous les cas particuliers de perte de données.