Dans notre précédent article, MTBF : Peut-il vous aider à prévoir la panne d'un disque dur ? , nous avons souligné que les méthodes les plus connues pour prédire la panne d'un lecteur de disque dur ne sont pas vraiment scientifiques. Par exemple, la présence de bruits grinçants et violents constitue un indicateur fiable qu'un lecteur de disque dur s'apprête à rendre l'âme, mais cela ne vous avance pas à grand-chose lorsque vos lecteurs se trouvent dans un centre situé à distance et qu'il vous est alors impossible de les entendre.
Quant aux fabricants de disques durs, ils semblent souvent délibérément induire en erreur lorsqu'ils estiment la longévité de leurs appareils de stockage. Ils utilisent un indicateur que l'on appelle temps moyen entre pannes (en anglais, MTBF), extrapolé à partir du fonctionnement de nombreux lecteurs pendant des semaines et des mois, ce qui peut donner des indications allant jusqu'à 1,5 million d'heures (presque 200 ans) pour des lecteurs de disque dur d'entreprise. La méthodologie est bonne, mais le résultat est assez éloigné de la durée de vie moyenne d'un disque dur.
La plupart de ces fabricants proposent néanmoins une méthode plus sophistiquée pour prédire la panne d'un lecteur de disque dur. Plus précisément, leurs appareils sont préinstallés avec un ensemble d'outils micrologiciels SMART (Self Monitoring, Analysis et Reporting Technology), qui communiquent des indicateurs sur le rendement du disque dur au système d'exploitation. Ces données peuvent être vues et analysées par l'intermédiaire d'un logiciel, offrant ainsi aux administrateurs informatiques la possibilité d'avoir plus d'informations sur l’état de santé de leur équipement de stockage.
Les indicateurs enregistrés par les outils SMART - que l'on appelle attributs - varient d'un fabricant à l'autre, mais on retrouve, en règle générale, le nombre d'heures pendant lesquelles le lecteur est resté allumé, le temps nécessaire pour que l'axe atteigne sa vitesse opérationnelle et le nombre de secteurs réaffectés.
Vérifier ses données SMART
Il est généralement assez simple de vérifier les données SMART de votre appareil de stockage. Il est possible d'acheter un programme conçu spécialement à cette fin, ce qui pourrait être judicieux si vous souhaitez obtenir des informations significatives à partir de ces données, mais il ne s'agit pas d'un pré-requis : si vous utilisez Windows, vous pouvez obtenir un compte-rendu rapide des attributs SMART de votre lecteur de disque dur et de leurs interprétations par l'intermédiaire de l'invite de commande.
Lire aussi : Qu’est-ce qu’un crash de tête de disque dur ?
Bien sûr, si vous cherchez une manière d’enregistrer et d'analyser les données SMART de manière plus proactive, différents outils sont à votre disposition sur diverses plates-formes et à différents niveaux de prix. Nous pouvons citer par exemple Ontrack EasyRecovery : si vous prenez l'utilisation d'outils SMART au sérieux pour surveiller l’état de santé de vos disques durs et prévoir des remplacements, c'est ce qu’il vous faut.
La fiabilité des outils SMART
Vous avez peut-être remarqué que nous n'avons pas encore parlé du degré de fiabilité des outils SMART en tant qu'indicateurs de l’état de santé d'un disque dur. Alors, sont-ils fiables ? La réponse est oui et non. Tandis que certains attributs SMART semblent véritablement utiles lorsqu'il s'agit de prédire la panne d'un lecteur de disque dur, il est également communément admis que le système comporte ses limites.
Il est important de souligner que les outils SMART ne peuvent pas prévoir 100% des plantages de disques durs, car ils ne sont pas tous prévisibles. Tandis que des erreurs qui résultent d'une usure mécanique naturelle et régulière ont tendance à apparaître comme des indicateurs SMART anormaux, ce n’est pas le cas des problèmes de fonctionnement et des pannes de composants électroniques soudains. Pour mettre ceci en perspective, une étude réalisée par Google en 2007 sur 100 000 lecteurs de disque dur grand public a démontré que moins des trois quarts (64%) des pannes sur une période de neuf mois n'étaient pas signalées dans leurs outils SMART à l'avance.
Un autre facteur qui met en doute l’utilité des attributs SMART est la manière dont ils varient d'un fabricant à l'autre, même en termes de méthodes de mesure d’attributs communs. Ainsi, un appareil Seagate et un appareil Western Digital avec un état de santé équivalent pourrait donner des indicateurs complètement différents concernant, par exemple, leurs taux d'erreurs d'accès.
En novembre dernier, le fournisseur de sauvegarde hébergée Backblaze a publié une étude fascinante concernant l'utilisabilité variable de différents attributs SMART. Basée sur des indications issues de presque 40 000 disques durs stockant 100 pétaoctets de données clients, cette enquête a révélé que sur 70 attributs disponibles, seulement cinq étaient véritablement des indicateurs fiables de panne de lecteur de disque dur. « Nous adorerions en utiliser plus - dans l'idéal, les vendeurs de disques durs nous diraient exactement ce à quoi correspondent les attributs SMART », écrit l'ingénieur Brian Beach.
En conclusion
En réalité, les outils SMART ne constituent pas une méthode 100% exacte pour savoir comment et quand l'un de vos lecteurs de disque dur s'apprête à rendre l'âme. Bien sûr, ils peuvent prédire certains types de pannes, en supposant que vous sachiez où regarder, mais d'autres peuvent survenir sans qu'aucun indicateur anormal ne pointe le bout de son nez.
En tant que tel, aucun utilisateur de systèmes de stockage avec un peu de jugeote ne se reposerait que sur SMART - ou tout autre système prédictif - pour empêcher la perte de ses données et planifier une continuité d'activité. La nature des appareils électromécaniques implique qu'il est toujours mieux de compter sur une combinaison de protections : redondance, sauvegarde et récupération de données, et pas seulement SMART.