Se sortir d’un mauvais pas avec un RAID logiciel mdadm défaillant

Rz_ESPAC020Une fois n’est pas coutume, un RAID logiciel qui craque et tout devient sombre !

Je donne ici quelques pistes qui m’ont permis de me tirer d’un mauvais pas avec une configuration RAID 5 logiciel contenant du LVM (Debian).

Regardez bien les Array State sur les partitions en RAID. Il y a une désynchronisation entre sda3 et les autres partitions. Il y a fort à parier que le sda3 déconne (pour s’en assurer, on peut passer un smartmontools et envisager de le remplacer)

# mdadm --examine /dev/sd[abcde]3 | egrep 'dev|Update|Role|State'
 /dev/sda3:
 State : active
 Update Time : Sat May 11 04:51:06 2013
 Device Role : Active device 0
 Array State : AAAAA ('A' == active, '.' == missing)
 /dev/sdb3:
 State : clean
 Update Time : Mon May 13 12:19:56 2013
 Device Role : Active device 1
 Array State : .AAAA ('A' == active, '.' == missing)
 /dev/sdc3:
 State : active
 Update Time : Mon May 13 12:19:56 2013
 Device Role : Active device 2
 Array State : .AAAA ('A' == active, '.' == missing)
 /dev/sdd3:
 State : active
 Update Time : Mon May 13 12:19:56 2013
 Device Role : Active device 3
 Array State : .AAAA ('A' == active, '.' == missing)
 /dev/sde3:
 State : active
 Update Time : Mon May 13 12:19:56 2013
 Device Role : Active device 4
 Array State : .AAAA ('A' == active, '.' == missing)

Un autre truc aussi pour vérifier quel disque déconne :

# mdadm -E /dev/sd*3 | egrep 'dev|Events'
/dev/sda3:
 Events : 154
 Device Role : Active device 0
 /dev/sdb3:
 Events : 269
 Device Role : Active device 1
 /dev/sdc3:
 Events : 269
 Device Role : Active device 2
 /dev/sdd3:
 Events : 269
 Device Role : Active device 3
 /dev/sde3:
 Events : 269
 Device Role : Active device 4

Le Events de sda3 n’est pas synchro…

Donc, on passe maintenant à la reconstruction du RAID.

On commence par le stopper

# mdadm --stop /dev/md0

On assemble les partitions cohérentes :

#mdadm --assemble --force /dev/md0 /dev/sdb3 /dev/sdc3 /dev/sdd3 /dev/sde3

Ensuite, à ajoute sda3 afin qu’il soit synchronisé avec les autres partitions

#mdadm --add /dev/md0 /dev/sda3

On peut ensuite repasser l’examination des partitions du RAID md0.

#mdadm --examine /dev/sd[abcde]3 | egrep 'dev|Update|Role|State'
 /dev/sda3:
 State : clean
 Update Time : Mon May 13 17:46:25 2013
 Device Role : Active device 0
 Array State : AAAAA ('A' == active, '.' == missing)
 /dev/sdb3:
 State : clean
 Update Time : Mon May 13 17:46:25 2013
 Device Role : Active device 1
 Array State : AAAAA ('A' == active, '.' == missing)
 /dev/sdc3:
 State : clean
 Update Time : Mon May 13 17:46:25 2013
 Device Role : Active device 2
 Array State : AAAAA ('A' == active, '.' == missing)
 /dev/sdd3:
 State : clean
 Update Time : Mon May 13 17:46:25 2013
 Device Role : Active device 3
 Array State : AAAAA ('A' == active, '.' == missing)
 /dev/sde3:
 State : clean
 Update Time : Mon May 13 17:46:25 2013
 Device Role : Active device 4
 Array State : AAAAA ('A' == active, '.' == missing)

C’est clean et en phase Array State : AAAAA (‘A’ == active, ‘.’ == missing) pour les 5 partitions

Il ne reste plus que à attendre que le RAID se reconstruise…et ça peut prendre du temps

cat /proc/mdstat
 Personalities : [linear] [raid0] [raid1] [raid10] [raid6] [raid5] [raid4] [multipath] [faulty]
 md0 : active raid5 sda3[5] sdb3[1] sde3[4] sdd3[3] sdc3[2]
 7691161600 blocks super 1.2 level 5, 512k chunk, algorithm 2 [5/4] [_UUUU]
 [>....................] recovery = 0.2% (5768528/1922790400) finish=1520.3min speed=21015K/sec

Cet article Se sortir d’un mauvais pas avec un RAID logiciel mdadm défaillant est apparu en premier sur PointRoot.org.

Vus : 1455
Publié par pointroot.org : 17