Récupérer des données depuis un environnement virtuel

Written By: Ontrack

Date Published: 30 avril 2020

Récupérer des données depuis un environnement virtuel

La virtualisation des systèmes informatiques s’est établie depuis longtemps sur un large front et domine le paysage de l’entreprise. Les avantages énormes de cette technologie sont évidents : une bien meilleure utilisation des systèmes existants, des besoins en matériel réduits ainsi que la diminution des achats et de la consommation d’énergie qui en découle. Il n’est donc pas étonnant que progressivement, toutes les applications possibles et imaginables soient réalisées virtuellement, et avec la possibilité de virtualiser des paysages de stockage entiers, la technologie s’est finalement établie dans les sociétés.

D’après Gartner, la plupart des firmes déclarent avoir recours à la virtualisation à 75 % ou plus. Le perfectionnement des hyperviseurs a contribué à rendre moins complexe la configuration et l’entretien des serveurs physiques, à améliorer grandement l’utilisation des serveurs et à accroître la flexibilité et la réactivité informatiques pour les besoins de l’entreprise. Il n’est pas étonnant qu’une part importante des systèmes informatiques modernes soient virtualisée. Mais que vous utilisiez VMware, Hyper-V, Citrix, Oracle ou tout autre hyperviseur, la virtualisation présente un inconvénient.

L’inconvénient de la virtualisation

Afin de transformer un serveur physique en machines virtuelles, une couche logicielle supplémentaire est ajoutée. Tandis qu’elle simplifie l’expérience utilisateur, la virtualisation augmente la complexité globale de l’environnement informatique car le matériel sous-jacent est détourné, compliquant ainsi la tâche des administrateurs pour savoir sur quel système physique leurs machines virtuelles fonctionnent ou quel système de stockage est utilisé pour une machine en particulier en cas de perte de données. Avec moins de personnes pour entretenir et contrôler un plus grand nombre de machines virtuelles (en comparaison avec les serveurs physiques), les chances que des problèmes et des pertes de données se produisent sont plus grandes.

Les principales causes de perte de données dans les environnements virtuels

Les données réunies dans le monde entier par Ontrack révèlent que les pertes de données dans les environnements virtualisés peuvent avoir plusieurs causes. Les principales raisons d’une perte de données dans une machine virtuelle sont les erreurs des utilisateurs, les ransomwares, les pannes matérielles et la corruption RAID. L’objet de cet article est d’exposer les éléments menant à une perte de données virtuelles et d’expliquer comment les fournisseurs en récupération des données dans le monde sont en mesure de résoudre un pourcentage élevé des cas de perte de données dans les environnements virtualisés, même les plus compliqués.

Problèmes de matériel ou dans le système RAID

Pour permettre de prévenir les pertes de données, les systèmes modernes utilisent souvent une sorte de réplication des données sur plusieurs lecteurs physiques (HDD ou SSD) qui sont consolidés en une unité logique unique. Cette protection des données peut être une solution matérielle ou logicielle. Un système RAID combine plusieurs disques durs ou bandes de données pour améliorer la redondance, accroître la fiabilité des données et booster la performance I/O (entrée/sortie). Le système RAID fragmente les données sur plusieurs disques et les réassemble à la demande de l’utilisateur ou lorsque le système en a besoin. Un système RAID robuste est nécessaire pour garder une trace de tout et gérer les données.

Les problèmes matériels auxquels les systèmes virtuels font face sont essentiellement les mêmes que dans les systèmes physiques, tels que les pannes de lecteurs, de contrôleurs, de composants serveurs et de courant. Mais la corruption du système RAID présente un défi encore plus important avec les machines virtuelles à cause de la nature de la virtualisation. Malheureusement, les pertes de données ne sont pas rares dans les appareils de stockage RAID. La complexité des matériels et logiciels RAID modernes est décuplée par la présence de la déduplication et de la compression. Ajoutez à cela une couche de virtualisation supplémentaire et vous augmentez les risques de panne. Les contrôleurs RAID sont responsables de la cartographie où toutes les informations se trouvent sur les nombreux disques à leur disposition. Mais si une configuration RAID est corrompue, les fichiers ne peuvent pas être reconstruits. Lorsque c’est la cas, l’inter connectivité de plusieurs systèmes peut entraîner une perte de données RAID importante ainsi que des temps d’arrêt.

Formatage / Problèmes logiciels

Le reformatage d’un disque, d’un disque virtuel, d’une matrice, d’un LUN, d’un vDisk, d’un volume ou d’un autre support de stockage et la réinstallation de logiciels peuvent entraîner une perte de données supplémentaire dans les environnements virtualisés. De manière spécifique aux machines virtuelles, par exemple, il peut y avoir un reformatage au niveau Guest ou Host. Une corruption peut également survenir à cause de correctifs ou de mises à jour défectueux sans une sauvegarde hors ligne, de la mise en œuvre mal planifiée d’un nouveau logiciel, de problèmes d’intégration ou d’une corruption de la base de données. Ces problèmes peuvent également entraîner une corruption des fichiers hôtes et une détérioration des systèmes de fichiers invités. Une perte de données due à l’allocation granulaire doit également être envisagée. Plutôt que d’allouer toutes les données dont la machine virtuelle aura besoin et de positionner les structures des systèmes de fichiers sur leurs offsets physiques spécifiés, l’allocation granulaire provisionne uniquement la quantité d’espace nécessaire immédiatement et ajoute d’autres blocs au disque virtuel à mesure qu’il grandit.

Ceci peut avoir pour conséquence un environnement virtuel sur le disque plus complexe et plus fragmenté. Si les pointeurs des métadonnées vers les données sont manquants ou endommagés, il devient difficile de trouver les différents fragments et de reconstruire le disque virtuel. D’autre part, la couche de modélisation à l’intérieur du disque virtuel peut être endommagée ou écrasée, ce qui rend le ré-assemblage très difficile.

Corruption des métadonnées du système de fichiers virtuel

Une autre source de perte de données est la corruption des métadonnées. Les métadonnées sont encore plus importantes dans les environnements virtualisés à cause du nombre de couches et de machines virtuelles qui existent. Un petit problème avec les métadonnées VMFS peut avoir de graves répercussions sur la disponibilité des données.

Erreurs des utilisateurs

Un grand nombre de ces sources de pertes de données peuvent être classifiées comme erreurs d’utilisateur de la part des administrateurs. Les privilèges d’accès font que les administrateurs peuvent supprimer des machines virtuelles par erreur. Et même lorsque les droits d’accès sont gérés correctement, les erreurs demeurent très courantes. Une quantité de pannes étonnamment importante est due à l’effacement par erreur de disques virtuels, à l’écrasement de machines virtuelles ou à la réattribution de leur espace. Une corruption des chaînes snapshot, c.-à-d. une série entière de snapshots corrompue, supprimée ou inaccessible pour une quelconque raison. Ceci peut détériorer les sauvegardes et compliquer la récupération des données virtuelles.

De manière ironique, la facilité d’utilisation des hyperviseurs modernes incite les organisations à moins investir dans la formation. Un personnel inexpérimenté se voit confier la responsabilité de gérer des environnements virtualisés de grande taille et en constante croissance. Les fournisseurs de services infogérés de petite et moyenne taille peuvent ne pas avoir assez de personnel expérimenté pour contrôler les environnements virtuels suffisamment souvent afin de détecter les problèmes à mesure qu’ils se développent. Dans certains cas, il arrive que les administrateurs informatiques ne lancent pas les mesures de sécurité adéquates sur une base de données ou omettent de documenter les modifications. Si le chiffrement est activé et qu’un volume est supprimé, par exemple, cela complique la tâche de récupération des données. Les roulements entre différents employés est une autre source de problèmes. Le nouvel arrivant n’est pas en mesure de comprendre les complexités des architectures virtualisées et il arrive qu’il supprime des machines virtuelles par inadvertance ou effectue des modifications entraînant une perte de données.

Dans certains autres cas, il est possible que le fichier plat d’origine soit stocké mais que personne ne soit en mesure de le trouver lorsqu’une perte de données se produit. La négligence vis-à-vis des sauvegardes est une autre raison courante pouvant causer une perte de données virtuelles. Et que dire des différents systèmes de stockage, des hyperviseurs et des équipes Guest travaillant en silos ? Une équipe peut créer un volume, une autre connecter l’hyperviseur et un administrateur Guest configurer la machine virtuelle. Ce type de structure organisationnelle est une fenêtre ouverte aux lacunes et erreurs. Le reformatage, l’écrasement et les suppressions peuvent survenir plus facilement. Ainsi, que peuvent faire les entreprises lorsqu’elles font face à une perte de données dans un environnement virtualisé ? Il n ‘y a pas de touche retour ou annuler. Une machine virtuelle supprimée est définitivement perdue. Les sauvegardes ? Elles sont souvent incomplètes ou corrompues.

Bonne nouvelle, vos données virtuelles peuvent être récupérées

Alors, que faire si votre organisation se trouve dans une situation où ses données virtuelles sont perdues ? La bonne nouvelle est qu’il existe de nombreux moyens de récupérer vos données, machines ou serveurs virtuels. AU moinbs partiellement, et dans de nombreux cas, en totalité.

  • Au niveau du stockage : Le premier point d’entrée est au niveau du stockage. Il est possible, dans certains cas, de récupérer les données directement à partir des lecteurs physiques en prenant une image des lecteurs et en lisant les données brutes disponibles sur le disque,
  • LUN ou RAID : La possibilité suivante est une tentative de récupération des données RAID à partir des volumes logiques LUN ou RAID. Si le contrôleur RAID est disponible, celui-ci peut être utilisé pour retrouver les nombreux morceaux de données éparpillés sur l’ensemble des disques virtuels. En déterminant quelle devrait être la configuration, les ingénieurs peuvent reconstruire la matrice virtuellement et accéder au stockage. Si le contrôleur RAID est corrompu, il peut être nécessaire d’émuler le contrôleur RAID et de reconstruire les parties manquantes,
  • Système de fichiers hôte : Le niveau supérieur suivant, chacun présentant un degré de difficulté plus élevé en matière de récupération, est le système de fichiers hôte. Il s’agit de VMFS pour VMware et de NTFS ou ReFS pour Hyper-V. Dans de nombreux cas, les données ne sont pas directement disponibles au niveau du stockage. Mais si les bons outils sont utilisés, les experts en récupération peuvent localiser les données à partir des blocs de données de stockage, les cartographier au niveau de l’hôte et les recompiler. Si ce processus n’offre pas une récupération adéquate, d’autres outils peuvent être utilisés pour pénétrer davantage à l’intérieur au niveau du système de fichiers invité. En examinant le système de fichiers virtuel, les spécialistes en récupération des données parviennent parfois à retrouver des données qui auraient sinon été perdues. Finalement, il est possible d’atteindre le système de fichiers invité et d’accéder aux données dissimulées dans des applications telles que SQL, Exchange, SharePoint, Oracle, Office, WinZIP, etc.
  • Architectures de stockage : Cela nécessite de comprendre chaque niveau et de savoir quels éléments sont disponibles et à quels endroits. Les utilisateurs connaissant bien les architectures de stockage peuvent localiser les données qui semblaient perdues en retrouvant certaines parties d’entre elles dans un niveau et d’autres parties dans un autre niveau. La meilleure façon d’illustrer ceci est en observant un système RAID. Il est un fait établi que les lecteurs finissent toujours par tomber en panne. Si un RAID 1 ou supérieur est utilisé, un nouveau lecteur peut être installé et la cartographie du stockage des données peut être reconstruite sans perte de données. Mais que se passe-t-il si la panne du lecteur excède la capacité de redondance du RAID ? Pour récupérer les données dans un tel cas, il est généralement nécessaire de contourner les pannes physiques qui se sont produites, de reconstruire le système de fichiers RAID, et d’évaluer les différentes couches et complexités de toute architecture virtualisée existante. Cela entraîne souvent des récupérations très difficiles et fastidieuses. Toutefois, dans de nombreux cas et avec un bon fournisseur, les efforts de récupération peuvent s’avérer fructueux. Assurez-vous que le fournisseur possède les outils et l’expertise nécessaires et bénéficie de partenariats directs avec les vendeurs de systèmes de stockage.

La récupération de machines virtuelles et serveurs virtuels par Ontrack

Avec plus de 30 ans d’expérience à l’échelle mondiale, Ontrack a récupéré des données virtualisées pour des milliers d’entreprises.

Nos ingénieurs créent une image des lecteurs, lisent les données brutes sur le disque, déterminent quelle devra être la configuration, puis reconstruisent la matrice virtuellement afin d’accéder au stockage. Pour ce faire, Ontrack a développé des outils permettant d’émuler le contrôleur RAID et de reconstruire les parties manquantes. La société a également développé une multitude d’autres outils permettant d’empêcher l’écriture de données supplémentaires sur les volumes, d’aborder les complexités des systèmes de fichiers virtualisés, et bien plus.

L’équipe de développement d’Ontrack met à jour en permanence ses outils pour les plateformes de virtualisation et les environnements de stockage les plus récents. Grâce à sa connaissance des différents supports de stockage, systèmes d’exploitation et architectures de stockage sous-jacentes, Ontrack propose des services complets pour la récupération de données, ainsi que des services de suivi pour une sauvegarde et une gestion des données intelligentes.

Quelques exemples :

Effacement accidentel d’un système NetApp

Un fournisseur en infogérance (MSP) coréen avait un client avec un système NetApp FAS8060 contenant 161 disques durs SAS de 900 GB chacun. Ils étaient disposés en deux agrégats distincts (68 lecteurs et 93 lecteurs). Le client présenta trois LUN Fibre Channel de 468 GB de chaque agrégat vers un serveur de production Sybase. Six LUN au total étaient associés en un seul pool de stockage avec trois volumes logiques créés à partir du pool. Un ingénieur de ce MSP tenta d’effectuer des modifications de configuration au système NetApp mais lança par inadvertance une commande d’effacement sur quelques-uns des LUN et supprima 45 GB de données du serveur Sybase. Le MSP risquait de perdre un contrat important et de possibles coûts liés à la responsabilité.

Ontrack est intervenu par le biais d’une consultation téléphonique. Dans les 12 heures suivant la perte de données, il a été demandé au MSP de déconnecter les agrégats afin d’éviter un écrasement des données. Il a ensuite été demandé au client de connecter l’ensemble des 161 disques durs des deux agrégats à un ordinateur sous Windows. Ce système fut ensuite connecté au serveur de récupération des données à distance d’Ontrack [HT2]. Les deux agrégats ayant le même nom, leur reconstruction s’est avérée très compliquée. Ainsi, les lecteurs ont dû être classés en groupes d’agrégat et reconstruits manuellement à partir d’un point dans le temps aussi proche que possible du moment où la commande d’effacement avait été activée.

C’est alors qu’un autre problème se présenta. Les volumes logiques étaient utilisés pour le stockage de données brutes par le serveur Sybase. Cette disposition avait rendu impossible l’extraction des données internes directement. La solution alternative fut d’extraire l’ensemble des six LUN sous forme de fichiers plats et de les coordonner avec le support technique NetApp afin de présenter de nouveau ces LUN au serveur Sybase. Les volumes logiques récupérés passèrent les contrôles d’intégrité et furent de nouveau opérationnels, sans perte de données.

Perte de données due au reformatage d’une infrastructure VMware

L’équipe informatique d’une société de production alimentaire basée à Singapour avait supprimé par erreur un entrepôt de données LUN de type VMFS de l’hôte ESXi VMware et l’avait relié à un serveur Windows. Cette action entraîna le reformatage du LUN au système de fichiers NTFS, la corruption des métadonnées VMFS de frontend et la perte de toutes les machines virtuelles se trouvant dans l’entrepôt de données. La société fit appel à Ontrack. Nos ingénieurs furent en mesure de reconstruire les structures VMFS afin de récupérer l’accès aux machines virtuelles stockées sur le système. Plusieurs machines virtuelles furent récupérées intactes, tandis que quelques autres nécessitèrent quelques réparations supplémentaires au niveau des systèmes de fichiers invités internes et une extraction des données qui en résultèrent.

Suppression de machines virtuelles

Un fournisseur de services de santé en Australie supprima par erreur sept machines virtuelles d’allocation granulaire d’un entrepôt de données de production. En raison du caractère sensible des données perdues, la société contacta immédiatement Ontrack et demanda que nos ingénieurs viennent directement sur place. Une fois arrivés au centre de données, ils furent en mesure de récupérer toutes les machines virtuelles, malgré quelques dommages apparents. À ce stade, d’autres réparations furent effectuées aux systèmes de fichiers invités de chaque machine virtuelle à l’aide des outils propriétaires d’Ontrack. Ce processus permit d’extraire davantage de données internes critiques vers un système de stockage externe. Bien qu’une légère perte de données ait été constatée, la majorité des données contenues dans les machines virtuelles furent récupérées.

En conclusion

La virtualisation permet de gagner du temps et d’éliminer une part de complexité du point de vue de l’utilisateur, mais elle apporte également un ensemble de difficultés unique, parmi lesquelles une augmentation de la corruption et de la perte de données. Qu’il s’agisse d’une corruption des volumes, de volumes supprimés, d’un ransomware, de sauvegardes virtuelles supprimées ou corrompues, d’une panne dans un système RAID, d’une panne matérielle, ou de fichiers supprimés ou corrompus à l’intérieur de systèmes de stockage virtualisés, la perte de données est une réalité pour toute personne ayant à gérer des systèmes virtuels.

La sauvegarde est nécessaire pour protéger les données d’entreprise, mais celle-ci est loin d’être infaillible. En tant que leader mondial en récupération des données, Ontrack se tient prêt à fournir ses services complets de récupération des données pour serveurs et systèmes de stockage virtuels. Les services de récupération des données Ontrack peuvent :

  • Récupérer les données de pratiquement tout type d’appareil de stockage, qu’il s’agisse de lecteurs de disques durs, flash et SSD, de serveurs de type NAS ou SAN, de sauvegardes sur bandes, ou de systèmes virtuels,
  • Minimiser les temps d’arrêts subis par les organisations grâce à des délais d’exécution rapides, des options de service d’urgence et le seul service de récupération des données à distance au monde.
  • Créer un rapport de tous les fichiers récupérables et de l’état de chaque fichier dans le cadre d’une évaluation, avant même que vous n’ayez à payer pour une récupération.

Newsletter

KLDiscovery Ontrack Sarl, 2, impasse de la Noisette, 91370 Verrières-le-Buisson, France (voir tous nos bureaux)