L' Open data vu du Cloud computing : une architecture comme une autre ?
Voici ma présentation lors du petit déjeuner "De l'Open Data à l'Open Cloud !" du 9 décembre 2013 en compagnie de Romain Lalanne, Responsable SNCF Open Data, et de Benjamin Jean, Inno3.
La présentation se démarque de l'approche commerciale cloud computing public, privé et hybride (dont on nous rebat les oreilles) par une autre axée sur les besoins en terme d'utilisation. En effet comme je le publiai dans ce post "Cloud privé , public, hybride etc : et si la vérité était ailleurs Mr Gartner ?", l'approche produit proposé initialement par Gartner a eu pour avantage majeur d'initier un marché à l'époque inexistant mais aujourd'hui souffre d'un maque de réalisme sur l'utilisation concrète du Cloud en entreprise.
Pour ma part je préfère utiliser les notions de cloud variable (ou à pics d'activité) ou de cloud linéaire (à évolution constante) on peut sans doute améliorer avec des termes plus pertinent mais l'essentiel est là: l'utilisation de l'infrastructure (oui oui c'est de cela dont on parle ) est-elle constante ou alors subit-elle des fluctuations ? Ce n'est pas anodin car les choix technologiques ne vont pas être les mêmes. En effet OpenStack sera particulièrement adapté à un usage Cloud variable alors qu'une solution comme oVirt correspondra mieux à un cloud linéaire (ne compter pas sur moi pour faire de la pub aux solutions propriétaires ).
Il est aussi important de rappeler que le cloud c'est aussi, et même surtout, une opportunité de passer à l'approche DevOps qui consiste à faire travailler plus étroitement les développeurs (d'application ou web) avec les administrateurs (Architecte et DBA) et d'améliorer ainsi l'agilité globale du projet !
En ce qui concerne l'Open Data les différents principes se concentreront sur la partie gestion des données et la flexibilité que l'on souhaite avoir. Au simple traditionnel backup, on ajoutera la possibilité de découper et de redonder les données afin de les rendre plus scalable et hautement disponible grâce à des solutions comme Ceph. Le cas échéant il faudra aussi choisir pour une infrastructure qui prend en charge, ou non, les pics d'activités notamment en fonction de la saisonnalité des données, de leur quantité et de la possibilité de télécharger celles-ci. Bref beaucoup d'éléments qui ne différencient en rien l'open data d'un autre type d'architecture. D'autres sujets sont aussi important comme la nature des bases de données et le choix entre SQL et NoSQL...Mais là je risque de dire encore plus de bêtises
En conclusion la réalité est comme d'habitude mixte, elle sera un mélange de SQL, NoSQL, de redondance, de cloud variable ou linéaire en fonction de la nature des besoins des utilisateurs !
Je vous invite à me faire part de votre point de vue et critiquer ce post !
A bientôt,
Jonathan