Dans cet article, nous vous montrons comment identifier un disque dur défectueux sur un Serveur Dédié Windows avec RAID logiciel et comment préparer le serveur pour le remplacement du disque défectueux.

Remarque

Cet article nécessite d'avoir des connaissances de base sur l'administration de serveurs avec Microsoft Windows. Si vous avez des questions ou si vous avez besoin d'aide supplémentaire concernant le remplacement d'un disque dur défectueux, veuillez contacter le Service Client IONOS.

Pour assurer la plus grande fiabilité possible, il est nécessaire que vous surveilliez le RAID logiciel de votre Serveur Dédié. Si vous découvrez qu'un disque dur est défectueux, ou si vous recevez un email de notification concernant un disque dur défectueux, vous devez contacter le service client pour le remplacer. Pour cela, vous devez identifier le disque dur défectueux et préparer le serveur pour le remplacement du disque.

Veuillez noter

Les systèmes RAID permettent une plus grande fiabilité et/ou une plus grande vitesse. Cependant, ils ne remplacent pas des sauvegardes régulières. Pour éviter toute perte de données, nous vous recommandons de sauvegarder régulièrement vos données. Assurez-vous également de sauvegarder vos données avant d'effectuer les étapes ci-dessous pour assurer la sécurité de vos données.

Diagnostic et identification des données nécessaires pour le remplacement du disque dur

Afin de détecter les erreurs de disque dur, nous vous recommandons de procéder comme suit :

Installez le programme Smartctl : Smartctl est un programme en ligne de commande permettant de surveiller les disques à l'aide de SMART (Self-Monitoring, Analysis and Reporting Technology). Avec ce programme, vous pouvez vérifier si un disque dur est défectueux.

Remarque

Dans certains cas, il peut arriver qu'un défaut de disque dur ne soit pas détecté via des valeurs SMART. Nous vous recommandons donc d'analyser également les fichiers journal (log) de votre serveur.

Installer Smartctl

Vous trouverez à l'adresse suivante les instructions d'installation des Smartmontools :

https://www.smartmontools.org/wiki/Download#InstalltheWindowspackage

Consulter des informations détaillées pour le diagnostic

Smartctl fonctionne de la même manière sous Windows et sous Linux. Pour cette raison, vous pouvez utiliser les mêmes commandes. Pour utiliser Smartctl pour diagnostiquer les erreurs, vous devez ouvrir l'invite de commande et vous rendre dans le répertoire où se trouvent les Smartmontools. Vous pouvez ensuite entrer les commandes Linux listées ci-dessous pour afficher des informations détaillées nécessaires.

Pour afficher une liste des disques durs, tapez la commande suivante :

smartctl --scan

Exemple :

C:\Program Files\smartmontools\bin>smartctl --scan

/dev/sda -d sat # /dev/sda [SAT], ATA device
/dev/sdb -d sat # /dev/sdb [SAT], ATA device
/dev/csmi0,2 -d ata # /dev/csmi0,2, ATA device
/dev/csmi0,3 -d ata # /dev/csmi0,3, ATA device

Pour obtenir des informations détaillées sur le disgnostic d'erreur, tapez la commande suivante :

smartctl -iHAl error [NOM DU DISQUE DUR]

Exemple :

C:\Program Files\smartmontools\bin>smartctl -iHAl error /dev/sda

Remarque

Veuillez noter que les interfaces des appareils doivent être spécifiées dans le format suivant :

Appareils SCSI / SATA : " smartctl - iHAl error /dev/sd[a-z]"

Exemple :

C:\Program Files\smartmontools\bin>smartctl -iHAl error /dev/sda

Après avoir entré la commande, les informations suivantes par exemple s'affichent :

C:\Program Files\smartmontools\bin>smartctl -iHAl error /dev/sda

smartctl 7.0 2018-12-30 r4883 [x86_64-w64-mingw32-2016] (sf-7.0-1)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Hitachi/HGST Ultrastar 7K2
Device Model:     HGST HUS722T1TALA604
Serial Number:    WMC6M0JAUEV8
LU WWN Device Id: 5 0014ee 00482c2ec
Firmware Version: RAGNWA07
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Jan 17 06:17:05 2019 CAST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG   VALUE WORST THRESH TYPE     UPDATED WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f 200   200   051    Pre-fail Always      -       0
  3 Spin_Up_Time            0x0027 141   140   021    Pre-fail Always      -       3933
  4 Start_Stop_Count        0x0032 100   100   000    Old_age  Always      -       15
  5 Reallocated_Sector_Ct   0x0033 200   200   140    Pre-fail Always      -       0
  7 Seek_Error_Rate         0x002e 200   200   000    Old_age  Always      -       0
  9 Power_On_Hours          0x0032 100   100   000    Old_age  Always      -       34
 10 Spin_Retry_Count        0x0032 100   253   000    Old_age  Always      -       0
 11 Calibration_Retry_Count 0x0032 100   253   000    Old_age  Always      -       0
 12 Power_Cycle_Count       0x0032 100   100   000    Old_age  Always      -       10
 16 Gas_Gauge               0x0022 000   200   000    Old_age  Always      -       1822115874
183 Runtime_Bad_Block       0x0032 100   100   000    Old_age  Always      -       0
192 Power-Off_Retract_Count 0x0032 200   200   000    Old_age  Always      -       6
193 Load_Cycle_Count        0x0032 200   200   000    Old_age  Always      -       9
194 Temperature_Celsius     0x0022 113   109   000    Old_age  Always      -       30
196 Reallocated_Event_Count 0x0032 200   200   000    Old_age  Always      -       0
197 Current_Pending_Sector  0x0032 200   200   000    Old_age  Always      -       0
198 Offline_Uncorrectable   0x0030 100   253   000    Old_age  Offline     -       0
199 UDMA_CRC_Error_Count    0x0032 200   200   000    Old_age  Always      -       0
200 Multi_Zone_Error_Rate   0x0008 100   253   000    Old_age  Offline     -       0

SMART Error Log Version: 1
No Errors Logged

Interprétation des paramètres et diagnostic

Analysez les informations détaillées que vous avez obtenues en utilisant la commandesmartctl -iHAl error [NOM DU DISQUE DUR].

La première section énumère les informations que vous pouvez utiliser pour identifier le disque dur :

=== START OF INFORMATION SECTION ===
Model Family:     Hitachi/HGST Ultrastar 7K2
Device Model:     HGST HUS722T1TALA604
Serial Number:    WMC6M0JAUEV8
LU WWN Device Id: 5 0014ee 00482c2ec
Firmware Version: RAGNWA07
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Jan 17 06:17:05 2019 CAST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

Cette section affiche, entre autres, le modèle et le numéro de série du disque dur testé.

Dans la deuxième section, l'état actuel du disque dur est évalué par Smartctl. Si, par exemple, la valeur "Failed" ou "UNKNOWN" s'affiche à la place de "PASSED", vous devez remplacer le disque dur dès que possible.

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Dans la troisième section, les valeurs SMART obtenues sont énumérées en détail. A côté de chaque valeur actuelle en pourcentage (VALUE), vous trouverez la valeur la plus mauvaise jamais mesurée (WORST) et la valeur limite correspondante (THRESH). Si la valeur actuelle en pourcentage (VALUE) ou la pire valeur mesurée (WORST) dépasse la valeur limite (THRESH), un avertissement SMART est affiché dans la colonne WHEN_FAILED (par ex. FAILING_NOW).

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   141   140   021    Pre-fail  Always       -       3933
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       15
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       34
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       10
 16 Gas_Gauge               0x0022   000   200   000    Old_age   Always       -       1822115874
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       6
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       9
194 Temperature_Celsius     0x0022   113   109   000    Old_age   Always       -       30
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

Les paramètres suivants peuvent indiquer une panne imminente du disque dur avant qu'un avertissement SMART ne s'affiche :

Reallocated_Sector_Ct : Spécifie le nombre de secteurs réassignés en raison d'erreurs de lecture. Si un secteur ne peut plus être lu, écrit ou vérifié correctement, un secteur de remplacement lui est automatiquement assigné. Le secteur défectueux est marqué en permanence comme illisible. Il s'agit d'un avertissement clair d'un problème d'interface naissant. Si cette valeur n'est pas égale à zéro, une panne de disque dur est souvent imminente. Cette valeur est l'indicateur le plus important pour le remplacement d'un disque dur.

Current_Pending_Sector_Ct : Spécifie le nombre de secteurs instables en attente de remappage. Si un secteur ne peut pas être lu ni écrit correctement, il reçoit d'abord le statut Current Pending Sector. Le secteur n'est pas réassigné dans cet état, puisque les données du secteur sont inconnues. Ce n'est qu'après plusieurs tentatives de lecture ou d'écriture infructueuses qu'un secteur de remplacement est attribué et le secteur défectueux est marqué de façon permanente comme illisible. La valeur Current_Pending_Sector_Ct est un indicateur important pour le remplacement d'un disque dur. Si cette valeur n'est pas égale à zéro, une panne de disque dur est souvent imminente.

Offline_Uncorrectable : Spécifie le nombre d'erreurs d'écriture et de lecture non corrigeables.

La dernière section traite du journal interne du disque dur. Les erreurs sont enregistrées ici si les tâches du serveur n'ont pas été traitées correctement par le disque dur. Si le nombre d'erreurs dans cette section se compose d'au moins deux chiffres, vous devez remplacer le disque dur dès que possible.

SMART Error Log Version: 1
No Errors Logged

Rassembler les informations pour le remplacement de disque

Les informations suivantes sont nécessaires pour remplacer le disque dur défectueux :

  • Désignation du disque dur dans le RAID

  • Numéro de série

  • Modèle

  • Fichier journal (facultatif)

Créer un journal SMART

Pour créer un SMART-Log complet, tapez la commande suivante :

smartctl –x [NOM DU DISQUE DUR]

Exemple :

C:\Program Files\smartmontools\bin>smartctl -x /dev/sda -x

Remarques
  • Si le SMART-LOG a été créé comme décrit ci-dessus, vous disposez d'assez d'informations pour faire remplacer le disque dur défectueux.

  • Si vous ne pouvez pas obtenirle numéro de série du disque dur défectueux à l'aide de Smartctl, vous pouvez également fournir au service client le numéro de série du ou des disques durs en fonctionnement.

Demander le remplacement du disque dur

Vous pouvez alors faire remplacer le disque dur défectueux. Veuillez contacter le Service Client IONOS.

Étapes à suivre après le remplacement du disque dur

Après avoir remplacé le disque dur défectueux, il est nécessaire de reconstruire le RAID logiciel. Pour plus d'informations sur la reconstruction d'un RAID logiciel, consultez l'article suivant :

Reconstruire le RAID logiciel (Windows)