Tracker : la renaissance

Tracker

Tracker est un moteur de recherche local pour votre ordinateur. Il permet d’effectuer des recherches de fichiers, mais aussi dans les fichiers eux même ou encore dans votre courrier électronique.

Ce projet est assez vieux, on parlait de sont inclusion dans le projet Gnome il y à quelques années déjà. Mais à cause de mauvaises performances et d’un développement lent il n’a jamais vraiment pu s’imposer sur le bureau Gnome.

Aujourd’hui c’est d’ailleurs un véritable manque, car aucun réel moteur de recherche n’est implémenté dans Gnome, alors que ce genre de fonctionnalités est maintenant standards ( que ce soit sous KDE, sous Windows Seven ou OSX ).

L’année 2009 à marqué toutefois un réveil du projet, on est ainsi passé de la version 0.5 à 0.7 en un peu plus d’un an et les premiers développements de la nouvelle version 0.8 devraient arriver en 2010.

3 Générations de moteurs de recherches

Pour mieux comprendre la suite de l’article, on va s’arrêter un peu sur les différents types de moteurs de recherches disponibles. Techniquement on peu diviser ces moteurs en 3 générations :

- La première génération ( qui correspond au petit moteur de recherche de fichiers de Gnome ), est un moteur de recherche simple, qui va aller chercher un fichier selon son nom, son type ou sa date de modification. Vous tapez « lenomdemonfichier », Et il s’en va le chercher sur votre ordinateur. Dans le meilleur des cas, il est doté d’un cache pour offrir un temps de réponse plus rapide.

Le gros inconvénient de cette première génération, c’est qu’elle est extrêmement limitée. Vous ne pouvez chercher que par le nom du fichier ou son extension. Et si vous ne vous rappelez pas du nom du fichier ou que vous tapez un nom légèrement erroné, vous n’aurez surement aucun résultat pertinent.

De fait ces moteurs de recherches sont peu utilisés. Et on préférera souvent avoir une bonne organisation de l’arborescence des répertoires pour éviter de perdre nos fichiers.

- La seconde génération de moteur de recherche s’est donc attachée à proposer un résultat de recherche un peu plus efficace. Ici il est question de reprendre les fonctionnalités du moteur de 1ere génération, mais en plus de lui permettre d’aller chercher le contenu des informations de chaque fichier ( lorsque c’est pertinent ). Le gros avantage c’est que la recherche devient un peu plus précise. Vous pouvez par exemple facilement retrouver un document texte sur un thème précis, en tapant un mot contenu dans ce document.

Tracker dans sa version stable 0.6.X fait parti des moteurs de seconde génération. Mais la encore la recherche reste peu utile, car le moteur de recherche ne pourra parcourir que le contenu de fichiers lisibles ( documents textes principalement ). Si vous souhaitez chercher d’autres types de documents, comme des images ou des vidéos, vous vous retrouvez donc avec le même problème que le moteur de première génération.

- C’est ici qu’intervient le moteur de recherche de 3éme génération, qui s’appuie sur le bureau sémantique. Le bureau sémantique consiste à construire un réseau d’informations sur l’ensemble des éléments du bureau; que ce soit les médias, les documents, les applications ou tout autre élément pertinent composant l’ordinateur ou son réseau. Pour chaque élément on va garder en base de donnée des informations pertinentes sur son contenu ( par exemple pour une photo l’auteur de la photo, la date de prise, le lieu, la définition… ). Il sera en plus possible d’associer des tags pour chaque élément ( exemple : photos de vacances ), permettant ainsi de regrouper les fichiers sans prendre en compte l’arborescence.

Enfin, pour rendre le système encore plus intelligent,le système créé des liens entre les différents éléments du bureau. Par exemple votre ami « Paul » vous envoie les photos de vacances que vous avez passés ensemble. Vous les stockez dans un répertoire. Puis quelques jours plus tard vous souhaitez les voir de nouveau. Il vous suffit de chercher « Paul » dans le moteur pour retrouver les fichiers qu’il vous a envoyé. Vous ajoutez le tag « Photo de vacances » et elles se retrouveront dans votre gestionnaire de photos dans la bonne catégorie ( si ce dernier supporte Tracker) .

Tracker 0.7 : le renouveau… expérimental.

Pendant l’année 2009, l’équipe de Tracker à décidé, de refondre totalement le projet. L’objectif est de créer un moteur interne performant, standardisé et facile d’utilisation.

Pour ce faire le projet c’est logiquement orienté vers des standards reconnus.

En premier SPARQL, qui est le langage utilisé pour effectuer des requêtes a la base de donnée de Tracker. SPARQL est un standard défini par la W3C, une des briques du futur web sémantique. Il est officiellement devenu une recommandation en janvier 2008 et permet d’effectuer des requêtes intelligentes en relation avec des documents,images, etc.

La seconde technologie qui fait son entrée dans Tracker s’appel NEPOMUK pour « Networked Environment for Personalized, Ontology-based Management of Unified Knowledge » ou en français : Environnement réseau pour une gestion ontologique personnalisée de la connaissance unifiée.
C’est ni plus ni moins que le standard défini par un projet Européen pour le bureau sémantique que l’on à vu plus haut.

C’est donc avec la version 0.7.X que ces fonctionnalités ont commencés à faire leurs apparitions. De sorte qu’aujourd’hui Tracker propose un moteur de recherche sémantique « simple ». Il manque encore en effet un certain nombre d’éléments comme les liens entre élément, ou plus simplement une meilleure intégration.

Enfin un dernier élément à prendre en compte dans Tracker, s’appel le « mineur ». Ce sont des modules qui viennent s’ajouter au moteur principal et qui vont avoir pour rôle d’aller chercher les informations sur des éléments spécifiques. Pour l’instant Tracker dispose de 3 type de « mineur » :
- Mineur de fichier, qui va aller chercher la liste des fichiers présents dans votre répertoire personnel et va en extraire le contenu.
- Mineur d’applications, qui récupère le nom et les descriptions des applications présentes sur votre ordinateur
- Le mineur de courrier électronique qui va aller chercher les courrier électronique et leur contenu dans Evolution.

Tracker 0.8 : première version stable

Avec la version 0.8, qui sera la prochaine version stable du moteur et qui devrait officiellement arriver mi 2010, on devrait voir arriver de nouvelles fonctionnalités, notamment de nouveaux mineurs :
- Le mineur rss : qui, comme son nom l’indique, permettra d’aller chercher dans le contenu Rss
- Le mineur internet : qui permettra de garder les informations sur les pages visités et de les retrouver facilement
- D’autres mineurs liéés aux services en lignes (Réseaux sociaux, documents en ligne, etc…)

Enfin le système devrait être encore optimisé vers une meilleure prise en compte des standards de bureau sémantique. Cette version est d’autant plus importante qu’elle pourrait être incluse dans Gnome comme projet officiel. La version 0.7 n’a été accepté qu’a titre de dépendance externe dans gnome 2.30. En cause, l’absence d’une version stable moderne, et le manque de maturité du projet.

Enfin l’équipe de Tracker travail en étroite collaboration avec l’équipe de Zeitgeist. Ce dernier projet permet de garder une trace des actions effectués par l’utilisateur dans le temps, sur les fichiers ou les applications.

Quelques liens :

- Site du projet
- Site du projet sur Gnome
- Blog d’un des développeurs

Vus : 506
Publié par Lemarinel : 37