Nouvelle donne pour la métrologie ?

J’avais rédigé l’année dernière un article sur les nouvelles approches apparaissant dans la gestion des logs. Je vais continuer dans cet article ce qui est en train de devenir une série sur les nouvelles approches de la supervision avec la métrologie.

Jusqu’à maintenant, un outil règne en maître quand il s’agit de stocker et grapher les données de performance issues de la collecte Nagios (et autres) : RRDTool. Certes, RRDTool est un excellent logiciel qui nous a rendu (et continue de nous rendre) de loyaux services. Pourtant, ceux qui l’utilisent au quotidien pourront peut-être souscrire avec moi aux quelques griefs qui vont suivre:

  • Le lissage des données dans le temps. Afin d’être efficient et de ne pas exploser votre capacité disque, RRD est basé sur un principe qui fait que plus vos données sont anciennes, plus elles sont « imprécises ».
  • RRDTool n’est pas toujours pratique. Difficile en effet de copier des données d’une base vers une autre, difficile encore de « scaler » une solution à bases de RRDTool et enfin difficile d’envisager une architecture de haute disponibilité avec lui.
  • La commande rrdgraph est vraiment « ésotérique » dans son paramétrage. Essayez de composer un graphique from scratch avec et vous verrez de quoi je parle.
  • Même si certains outils permettent de contourner ce point, les graphes sont plats. Pas de zoom, pas de valeur exacte d’un point au survol de la souris.

C’est dans ce contexte que je souhaite vous présenter quelques nouveaux outils, nouvelles briques qui pourraient bien permettre d’envisager d’aller plus loin dans le traitement de vos données de performance et vous permettre « d’exploser » les limites exposées ci-dessus.

Graphite

GraphiteLa solution qui sort du lot en ce domaine en ce moment s’appelle Graphite. C’est à la fois un moteur de stockage des données de performance et un frontend de visualisation de celle-ci. Si vous avez suivi, il n’y a donc pas de collecte avec Graphite ;)

C’est plutôt bien fait; moteur Python et frontend Django et le projet arrive tranquillement en version 1.0. Shinken, depuis sa version 1.0 permet notamment d’envoyer ses données de performance vers celui-ci. Il existe un équivalent (que je n’ai pas testé) pour Nagios. Il est aussi possible de venir interroger des valeurs stockées par Graphite depuis Nagios avec des scripts comme celui-ci.

Graphene et autres pour Graphite

GrapheneEt pour compléter le tableaux, des interfaces plutôt novatrices font leur apparition comme Graphene. Aller jeter un œil sur la doc de Graphite pour vois la liste grandissante des outils qui peuvent fonctionner avec.

Canopsis

Canopsis
La deuxième solution, encore jeune certes sur bien des points mais utilisable pour créer des tableaux de bord de métriques est Canopsis. Les graphiques générés par celle-ci sont certainement les plus « user friendly » avec possibilités de zoom, de superposition de données… Y a encore du boulot mais c’est prometteur.

OpenTSDB

OpenTSDBSi vous avez vraiment beaucoup de données de performance à stocker, tournez-vous vers OpenTSDB. Leur site parle de billions de points de mesure stockés (j’en frémis) et il est possible de grapher les données depuis Graphite. Il vaut mieux par contre éviter je crois leur partie frontend avec des graphes générés par Gnuplot; pas vraiment ce que j’appelle une nouvelle approche :)

Collectd et consorts

Et enfin pour ceux qui pensent que collecter les données de performance avec un « Nagios like » n’a pas de sens parce que l’intervalle de collecte (5 mn habituellement) n’est pas assez court ou que les données récoltées ne sont pas assez précises, je ne pourrais que trop leur conseiller de revoir un projet dont nous avons déjà parlé sur monitoring-fr.org; à savoir Collectd. Il se trouve que celui-ci a aussi bien évolué de son côté et sait maintenant entre autres, envoyer les données collectées vers Graphite, Canopsis mais aussi (tiens donc ;) vers MongoDB. Vous pouvez aussi jeter un œil sur Statsd.

Après ce modeste tour d’horizon des nouvelles pratiques en matière de métrologie devrait venir un nouvel article sur les nouvelles tendances à venir en matière de configuration de nos logiciels de supervision. En attendant, vous avez de quoi, si vous le souhaitez, vous passer de RRDTool. À vos consoles !

Vus : 2231
Publié par Monitoring-FR : 139