Presque tout le monde a entendu parler des bruits émis par les disques durs lorsqu’ils sont sur le point de subir une défaillance ou simplement lorsqu’ils sont déjà en panne. Il s’agit d’une indication que la durée de vie du lecteur est arrivée à son terme et que vous allez faire face à une perte de données ou qu’il vous reste très peu de temps pour récupérer vos précieuses données.
Comme nous en avons déjà parlé en quelques occasions dans les articles de notre blog, la façon la plus sûre de réagir dans un tel scénario est de faire appel à des professionnels et de laisser les experts récupérer le contenu des disques durs (ou d’essayer de le faire vous-même avec un logiciel de récupération des données une fois et prendre le risque de ne récupérer qu’une partie des données se trouvant sur le disque et de rendre une récupération des données ultérieure par les experts plus difficile, voire impossible dans certains cas).
Ce que la plupart des personnes (et même des experts) ne savent pas, c’est que le bruit ne signifie pas seulement qu’il pourrait y avoir un problème, mais que le bruit lui-même peut être la cause d’une grave défaillance d’un disque dur et peut entraîner une perte de données ! Ce ne serait pas nécessairement le cas lorsque vous placez un haut-parleur directement près de votre ordinateur de bureau ou portable et que vous écoutez de la musique avec un volume raisonnable – encore que les vibrations pourraient faire sauter la tête de lecture-/écriture de votre disque – mais par exemple une alarme incendie dans un centre de données peut causer des problèmes. Sachant que l’utilisation d’extincteurs à eau n’est pas possible dans une telle configuration parce que les serveurs informatiques et les systèmes de stockage ainsi que leurs précieuses données pourraient être endommagés, les systèmes d’extincteurs à poudre chimique sont les plus couramment utilisés dans les centres de données aux quatre coins du monde.
Ce phénomène est connu depuis 10 ans maintenant (il a évolué aux alentours de 2007 et la raison pour cela a été découverte en 2008) lorsque le premier incident de la sorte s’est produit. Au début, les experts pensaient que le gaz inerte utilisé dans les systèmes modernes d’extinction d’incendie était la cause du problème, parce que lorsque toute la fumée avait été évacuée et qu’ils ont vérifié les systèmes de stockage, ils se sont rendu compte que de nombreux disques durs avaient subi une défaillance et avaient même perdu des données. En analysant le cas, il est apparu clairement que ce n’était pas le gaz utilisé par le système qui était la cause, mais le bruit que le système d’extinction d’incendie produit, lorsque le gaz inerte en question est libéré par le système à grande vitesse et avec une pression élevée.
Le gaz inerte (gaz noble) est généralement un mélange de nitrogène, d’argon et de dioxyde de carbone. Lorsque les systèmes d’extinction d’incendie à gaz inerte sont déclenchés, la quantité d’oxygène dans l’air est réduite à un volume de 13,5 % – un volume de 10 % entraînant le déplacement de l’incendie dans la salle des serveurs/de stockage, étant donné qu’un niveau d’oxygène moins élevé empêcherait toute combustion. Des clapets à surpression sont utilisés pour limiter la pression en permettant au volume d’air correspondant d’être déplacé en dehors de la salle. Une analyse a montré que les changements de pression n’affectaient pas les disques durs. D’autre part les chutes de température n’affectent pas non plus les disques durs de façon significative. Dans ce cas, quelle était la cause du dysfonctionnement des disques durs et de la perte des données ?
Il s’agissait du bruit produit pas les systèmes d’extinction ! Il existe typiquement deux sources de bruit principales : d’abord les sirènes d’alarme, ensuite les orifices qui libèrent le gaz inerte à grande vitesse et avec une pression très élevée. Dans plusieurs essais de laboratoire menés par Siemens en 2009 et en 2014, les scientifiques ont découvert que la plupart des disques durs créent des problèmes lorsqu’ils sont exposés à un bruit supérieur à 120 dB. Cependant, certains disques durs commencent à rencontrer des problèmes à partir de 110 dB.
Il s’avère qu’à cause des tolérances microscopiques à l’intérieur d’un disque dur rotatif moderne, les bruits forts peuvent les empêcher de fonctionner et même entraîner une défaillance permanente. Ceci est dû au fait que les lecteurs de disques durs modernes contiennent à présent jusqu’à 250 000 pistes de données par pouce. Pour la lecture et l’écriture, l’élément doit se trouver à ±15 % de l’espacement des pistes de données. Ceci implique que compte tenu du fait que davantage de pistes de données se trouvent à présent sur un pouce, il ne reste presque plus de tolérance lorsque la tête de lecture-/écriture subit un décalage dû aux vibrations causées par le son. C’est pourquoi ce problème a fait son apparition au cours de la deuxième moitié de la dernière décennie, lorsque les disques durs sont arrivés sur le marché.
Des défaillances ont été rapportées en Australie, en France, et plus récemment en septembre dernier (2016) où une panne s’est produite dans le centre de données principal d’une banque située à Bucarest, en Roumanie. Et les dégâts provoqués par le bruit étaient très lourds :
Les clients de la banque ING dans la capitale roumaine ne pouvaient plus ni utiliser leurs cartes de débit, ni effectuer leurs opérations bancaires en ligne, ni réaliser leurs transactions par carte de crédit parce qu’un essai de leur système d’extinction d’incendie a mal tourné. Au cours des tests de divergences de pressions, le système d’extinction d’incendie a produit un grand bruit pendant la libération du gaz inerte. La banque a indiqué que le bruit produit par les orifices du système d’extinction d’incendie à gaz inerte a atteint jusqu’à 130 dB, largement assez pour dérégler complètement l’alignement des composants physiques du lecteur de disques durs et entraîner un arrêt de plusieurs dizaines de disques durs, provoquant une perte des précieuses données. Les experts pensent que les serveurs n’étaient pas assez protégés pour retenir les fréquences fortes et élevées causées par les orifices lorsque le gaz inerte a été libéré dans la salle. Le site a été mis hors ligne et la banque s’en est remise entièrement à son centre de données de secours, situé quelques kilomètres plus loin. Plusieurs jours ont été nécessaires pour remettre le site en ligne.
Sachant que les systèmes d’extinction d’incendie à gaz inerte sont essentiels pour tout centre de données, comment les employés responsables peuvent-ils se protéger contre une telle perte de données ? Voici quelques conseils à considérer afin de protéger les disques durs contre une défaillance et une perte de données liée au bruit :
- N’utilisez et n’achetez que des serveurs et des systèmes de stockage dont les parois latérales des racks sont dotées de revêtements spéciaux anti-bruit. Par ailleurs, plusieurs fabricants proposent maintenant des racks dotés de portes spéciales permettant de réduire les bruits forts,
- Enfermez les lecteurs dans des racks anti-bruit et laissez les portes des racks closes,
- En cas d’alarme incendie, essayez de couvrir la sirène,
- Positionnez les emplacements de la sirène et des orifices pour le gaz afin qu’ils n’émettent pas directement sur les disques durs,
- Augmentez le nombre d’orifices d’extinction et diminuez leurs espacements afin de réduire leurs niveaux d’émission de bruit,
- Utilisez des disques SSD ou des bandes comme supports de stockage lorsque c’est possible,
- Effectuez des sauvegardes régulièrement, et lorsque c’est possible, reproduisez les données critiques et stockez-les dans des locaux en dehors du site ou dans des centre de données secondaires.
Mais n’oubliez pas : même en prenant ces précautions, un incendie peut toujours survenir et le système être endommagé. Si jamais vous subissez une perte de données à cause d’un incendie, d’un dégât des eaux ou du bruit, il est préférable que vous fassiez appel à des professionnels experts en récupération des données qui possèdent une connaissance approfondie de ce qui doit être fait (et de ce qui doit être évité) après un tel incident. Parfois le système peut sembler quasiment intact, mais la fumée ou d’autres gaz néfastes peuvent avoir pénétré à l’intérieur du rack des disques durs et causé des problèmes, ce qui pourrait ne pas être évident au premier abord.
Récupération de données par type de dommage