RAID logiciel dans une Ubuntu 10.04.1 server (2).

Un disque

Plus tôt cette semaine, je publiais un billet concernant l’installation d’un RAID logiciel (RAID 1) dans une Ubuntu 10.04.1 server. Sans vouloir revenir sur la définition d’un RAID 1, rappelons simplement que cette solution permet une redondance des données en disques en miroir et peut tolérer la panne d’un disque.

En fin de billet, je précisais qu’une prochaine étape serait les procédures à suivre dans le cas de la panne d’un disque, ce billet d’aujourd’hui en discutera donc.

Tout d’abord, précisons que la configuration proposée dans le billet précédant comporte une lacune majeure (voir la discussion à la fin du billet) compliquant grandement la récupération des données. En effet, puisque la partition boot (nécessaire au démarrage) n’est présente que sur le premier disque, la perte du second disque est facilement récupérable, le système pouvant quand même démarrer. Alors que la panne du premier disque empercherait le système de démarrer.

J’ai donc réinstallé mon serveur en partitionnant (2 partitions par disque) mes deux disques de manière identique (une autre possibilité est d’avoir une seule partition par disque, un seul raid sur lequel nous pouvons appliquer un LVM, mais je n’ai pas retenu cette solution pour ce billet).

Pour ensuite créer deux périphériques multidisques.
Identiques aux partitions physiques, RAID no 0 (/dev/md0) et RAID no 1 (/dev/md1)

Pour ensuite créer sur ces deux partitions, le swap et la partition racine en ext4.

Et poursuivre l’installation normalement.

Lorsque l’installation est terminée et que vous êtes authentifié dans le système, il est possible de vérifier l’état du RAID en tapant pour le premier périphérique:

sudo mdadm --detail /dev/md0

et pour le second périphérique:

sudo mdadm --detail /dev/md1

La panne

Pour simuler la panne d’un disque, je l’ai carrément déconnecté un disque du système. Au démarrage, le système détecte l’anomalie et nous demande si l’on veut démarrer en mode dégradé (toute nouvelle défaillance entrainant la perte de données).

On peut s’en assurer une fois dans le système en tapant :

sudo mdadm --detail /dev/md1

Supposons que nous avions mis au démarrage un nouveau disque de remplacement. Avant son installation, nous devons nous assurer que notre celui-ci est partitionné de façon identique. On suppose que sda est le disque fonctionnant normalement et sdb le nouveau disque. On enregistre les informations de partitions.

sudo sfdisk -d /dev/sda > sda.bak

Et on les applique au disque sdb.

sudo sfdisk /dev/sdb < sda.bak

Reste à ajouter ce nouveau disque à notre RAID

sudo mdadm --manage /dev/md0 --add /dev/sdb1
sudo mdadm --manage /dev/md1 --add /dev/sdb2

On peut vérifier la reconstruction en tapant :

sudo mdadm --detail /dev/md0
sudo mdadm --detail /dev/md1

Pour le monitorage, je n’ai pas vraiment exploré mdadm, mais j’ai remarqué que dans Webmin il i y a un module qui permet de recevoir un courriel en cas de défaillance

Également à lire.....

Vus : 1103
Publié par ProfNoel : 41