La supervision pilotée par le comportement

J’ai découvert avec cucumber-nagios bien plus qu’un simple plugin supplémentaire pour Nagios. Celui-ci prétend en effet nous amener vers le nirvana de ce que les anglophones appellent « Behaviour Driven Infrastructure » que nous pouvons traduire approximativement par Infrastructure piloté par le comportement. Que cache ce terme, en quoi peux-t’il s’appliquer au domaine de la supervision sont quelques unes des questions auxquelles nous allons tenter d’apporter sinon des réponses; au moins des éclaircissements.

La représentation traditionnelle d’un SI en supervision

Aujourd’hui, tous les systèmes de supervision représentent un système de supervision comme un ensemble de serveurs sur lesquels tournent des services. C’est une représentation technique des choses qui associe la notion de santé d’une système d’informations …. Beaucoup de clients aujourd’hui souhaitent vérifier le matériel, les processus,

Cette représentation traditionnelle d’un système d’informations, au moins dans le domaine de la supervision, semble de plus en plus poussée vers l’obsolescence dû à quelques évolutions majeures intervenues dans nos SI depuis 5 ans.

Quelques problèmes

  • La redondance et la haute disponibilité qui rendent la représentation traditionnelle plus lourde à modéliser.
  • La virtualisation massive des systèmes d’informations des entreprises, que ce soit avec Xen, VMware, KVM… amenant une distinction supplémentaire entre serveurs physiques et serveurs virtuels dépendant d’un serveur physique.
  • Le Cloud qui est en train de faire exploser la notion même de matériel puisque vous ne savez plus à un instant temps « T » quels sont les composants de votre infrastructure qui sont sollicités.

Du coup, les systèmes de supervision actuels souffrent de plus en plus pour représenter la complexité des interactions entre serveurs actifs, non actifs, physiques, virtuels… Les conséquences en exploitation sont nombreuses avec des difficultés croissantes à pouvoir décider ce qui ressort d’un problème, d’un incident, ce qui devrait être notifié, escaladé. Certains nous promettent le nirvana (encore ;) en portant la notion de corrélation à un niveau jamais atteint et difficilement exploitable. Ils nous fournissent des moteurs de corrélation de plus en plus complexe à paramétrer et configurer. Impasse ?

La représentation comportementale de votre SI

Les auteurs de Cucumber qui est à la base du plugin préfère ouvrir une autre voie en partant du principe qu’un système doit se comporter d’une certaine façon pour rendre le service attendu.

Quelques bénéfices

  • Vous n’avez plus à modifier les paramètres de chaque sonde à chaque modification de votre infra. Le comportement observé devant en toute logique resté le même.
  • Vous êtes directement orienté vers l’impact métier du problème.
  • Vous n’êtes pas alerté au moindre problème, seulement pour ceux impactant l’activité ou le service rendu.
  • Vous prenez en compte l’expérience utilisateur. C’est bien là le principal non ?

Les outils pour le faire

La trousse à outils pour arriver à ce type de supervision est train de se mettre en place au niveau du monde de la supervision Open Source et nous vous avons déjà présenté ici Watir et Cucumber, pierres angulaires de ce type de supervision à venir… ou non

Alors à vous de me dire si ces idées sont intéressantes et/ou se contentent de suivre une nouvelle mode comme nous en connaissons régulièrement. À vos commentaires :)

RSur le même sujet:

  1. Quand la supervision rencontre la Sécurité Quand la supervision rencontre la sécurité ça nous fait une solution Open Source digne de ce nom à base de : Nagios Prelude Snort Ossec Ce projet a été élaboré en labo par Ludovic VALENTIN dans le cadre d’un stage. La documentation qui en est...
  2. L’évolution de la supervision Cet article est une petite rétrospection de l’évolution de la Supervision dans la gestion d’un S.I d’entreprise. Le domaine de la Supervision a été très longtemps inconnu ou ignoré dans la gestion d’un S.I d’entreprise. A ces débuts, ce genre d’outil voit le jour sur...
  3. Zabbix Zabbix est une application libre (open source) de supervision des systèmes et des réseaux en infrastructure IT, développée en C. L’interface web est quant à elle, développée en PHP et en JavaScript. Mise à part les versions serveur et proxy qui sont exclusivement sur Unix,...
  4. Supervision 2010 : Les forces en présence Il m’a paru intéressant avec l’année 2009 que nous venons de vivre en supervision Open Source de faire le point sur les forces en présences en début de cette année 2010. Côté Nagios, 2010 pourrait voir une redistribution des cartes entre le Nagios Core et...
  5. Standards de la supervision Le monde de la supervision et du management des infrastructures en général possèdent ses normes et standards, pour la plupart émergeants, dont sont présentés ici les plus significatifs. Ces standards sont pour la plupart gérés par la DMTF Standards de la supervision IPMI – Intelligent...

Vus : 1553
Publié par Monitoring-FR : 139