Se sortir d’un mauvais pas avec un RAID logiciel mdadm défaillant
Une fois n’est pas coutume, un RAID logiciel qui craque et tout devient sombre !
Je donne ici quelques pistes qui m’ont permis de me tirer d’un mauvais pas avec une configuration RAID 5 logiciel contenant du LVM (Debian).
Regardez bien les Array State sur les partitions en RAID. Il y a une désynchronisation entre sda3 et les autres partitions. Il y a fort à parier que le sda3 déconne (pour s’en assurer, on peut passer un smartmontools et envisager de le remplacer)
# mdadm --examine /dev/sd[abcde]3 | egrep 'dev|Update|Role|State' /dev/sda3: State : active Update Time : Sat May 11 04:51:06 2013 Device Role : Active device 0 Array State : AAAAA ('A' == active, '.' == missing) /dev/sdb3: State : clean Update Time : Mon May 13 12:19:56 2013 Device Role : Active device 1 Array State : .AAAA ('A' == active, '.' == missing) /dev/sdc3: State : active Update Time : Mon May 13 12:19:56 2013 Device Role : Active device 2 Array State : .AAAA ('A' == active, '.' == missing) /dev/sdd3: State : active Update Time : Mon May 13 12:19:56 2013 Device Role : Active device 3 Array State : .AAAA ('A' == active, '.' == missing) /dev/sde3: State : active Update Time : Mon May 13 12:19:56 2013 Device Role : Active device 4 Array State : .AAAA ('A' == active, '.' == missing)
Un autre truc aussi pour vérifier quel disque déconne :
# mdadm -E /dev/sd*3 | egrep 'dev|Events'
/dev/sda3: Events : 154 Device Role : Active device 0 /dev/sdb3: Events : 269 Device Role : Active device 1 /dev/sdc3: Events : 269 Device Role : Active device 2 /dev/sdd3: Events : 269 Device Role : Active device 3 /dev/sde3: Events : 269 Device Role : Active device 4
Le Events de sda3 n’est pas synchro…
Donc, on passe maintenant à la reconstruction du RAID.
On commence par le stopper
# mdadm --stop /dev/md0
On assemble les partitions cohérentes :
#mdadm --assemble --force /dev/md0 /dev/sdb3 /dev/sdc3 /dev/sdd3 /dev/sde3
Ensuite, à ajoute sda3 afin qu’il soit synchronisé avec les autres partitions
#mdadm --add /dev/md0 /dev/sda3
On peut ensuite repasser l’examination des partitions du RAID md0.
#mdadm --examine /dev/sd[abcde]3 | egrep 'dev|Update|Role|State' /dev/sda3: State : clean Update Time : Mon May 13 17:46:25 2013 Device Role : Active device 0 Array State : AAAAA ('A' == active, '.' == missing) /dev/sdb3: State : clean Update Time : Mon May 13 17:46:25 2013 Device Role : Active device 1 Array State : AAAAA ('A' == active, '.' == missing) /dev/sdc3: State : clean Update Time : Mon May 13 17:46:25 2013 Device Role : Active device 2 Array State : AAAAA ('A' == active, '.' == missing) /dev/sdd3: State : clean Update Time : Mon May 13 17:46:25 2013 Device Role : Active device 3 Array State : AAAAA ('A' == active, '.' == missing) /dev/sde3: State : clean Update Time : Mon May 13 17:46:25 2013 Device Role : Active device 4 Array State : AAAAA ('A' == active, '.' == missing)
C’est clean et en phase Array State : AAAAA (‘A’ == active, ‘.’ == missing) pour les 5 partitions
Il ne reste plus que à attendre que le RAID se reconstruise…et ça peut prendre du temps
cat /proc/mdstat Personalities : [linear] [raid0] [raid1] [raid10] [raid6] [raid5] [raid4] [multipath] [faulty] md0 : active raid5 sda3[5] sdb3[1] sde3[4] sdd3[3] sdc3[2] 7691161600 blocks super 1.2 level 5, 512k chunk, algorithm 2 [5/4] [_UUUU] [>....................] recovery = 0.2% (5768528/1922790400) finish=1520.3min speed=21015K/sec
Cet article Se sortir d’un mauvais pas avec un RAID logiciel mdadm défaillant est apparu en premier sur PointRoot.org.