2 moteurs de recherche libres et décentralisés Seeks et Yacy 2/2

Après vous avoir présenté Yacy, c’est au tour d’une autre solution dénommée Seeks. L’approche proposée est différente. Seeks s’apparente davantage à un meta-moteur doté de fonction d’apprentissage de vos préférences de navigation et d’un fonctionnement en pair à pair.

Seeks recherche P2P Installation

Il y a différentes possibilités selon la distribution GNU/Linux que vous utilisez. Elles sont décrites sur cette page du Wiki de Seeks. J’ai personnellement testé l’installation sur une machine virtuelle avec la distribution Debian en version 6.0. J’ai utilisé pour cela le dépôt mis à disposition à cet effet.

Après quelques soucis, peut-être liés à mon installation et avoir tenté de compiler Seeks suite à l’indisponibilité du dépôt Debian, j’ai finalement réussi à faire fonctionner ce dernier. Mais c’est essentiellement grâce au retour en ligne du dépôt Debian qui permet alors facilement d’installer les librairies dont a besoin Seeks pour fonctionner.

Je n’ai pas pu cependant faire fonctionner la version dite “experimental” et j’ai donc continué mes tests sur la version stable qui, elle, n’a posé aucun problème. J’ai laissé quelques traces de cette expérience sur le forum francophone de seeks, où l’on a répondu à mes questions rapidement.

Par défaut, Seeks fonctionne comme un proxy web. Il faut donc configurer votre navigateur pour passer par seeks. Les recherches sont alors interceptées et redirigées vers Seeks qui vous présentera le résultat.

Il est également possible de configurer Seeks pour disposer d’une page de type portail de recherche si on souhaite rendre son installation public à l’image par exemple de www.seeks.fr.

Utiliser Seeks

On ne peut pas vraiment comparer Yacy et Seeks, car les deux logiciels n’ont pas fait le même choix technologique. Là où Yacy est un “pur” moteur de recherche, Seeks est un méta-moteur. C’est-à-dire qu’il construit le résultat de ces recherches en allant interroger d’autres moteurs. Il effectue alors une synthèse des différents résultats pour les soumettre à l’utilisateur.

En face de chaque résultat se trouve une icône indiquant l’origine du résultat, à savoir le moteur de recherche dont il est issu. Il est également possible de filtrer le résultat des recherches par type de média : texte, image, vidéo ou encore par tweet ce qui est pour le moins original mais restreint à Twitter à ce que j’ai pu voir. Autre option, le regroupement par type qui permet de regrouper les résultats selon qu’il s’agisse de pages web, de wiki ou encore de vidéos.

Quand on compare les résultats avec une recherche sur Google, on retrouve effectivement une bonne partie des résultats, mais pas dans le même ordre ; certains sont d’ailleurs absents. Cela est probablement dû au fait que Google est interrogé par Seeks au lieu de recevoir la requête de mon navigateur. Il doit manquer toutes les informations que Google stocke sur notre profil et qui lui permettent “d’améliorer” les résultats présentés. Mais est-ce un mal ?

Les résultats vont aussi être triés selon nos habitudes de navigation, mais cette fois c’est Seeks qui gère ces informations. J’ai constaté ce comportement en voyant que des articles que j’avais consultés, étaient remontés dans le résultat d’une seconde recherche par rapport à une première fois.

Seeks offre aussi un fonctionnement en mode pair à pair. L’objectif est d’affiner encore les résultats à l’aide de ceux des autres utilisateurs. Bien évidement ce partage d’informations se fait de façon anonyme et il n’est pas possible de savoir qui a cherché quoi à l’aide de seeks. Tout passe par une table de hachage distribuée. Elle permet de mettre en relation les utilisateurs effectuant des recherches similaires.

La contre-partie de ce fonctionnement en mode pair à pair est le même que pour Yacy, les temps de réponses sont plus long. Une différence sur ce point, puisque dans Seeks il faut ajouter les pairs avec lesquelles on souhaite collaborer. Il n’y a pas comme pour Yacy de mécanisme de découverte automatique.

Et si on faisait YaSeeks ?

Globalement, Seeks donne des résultats au premier abord plus pertinents que ceux de Yacy, mais cela n’est guère étonnant au vu des choix technologiques effectués. Je n’ai pas essayé de voir si cela pouvait fonctionner, mais il serait intéressant de vérifier si Seeks peut utiliser Yacy comme moteur de recherche. Nous aurions alors une plateforme alliant le meilleur des deux technologies, tout en permettant, grâce à Yacy, de réduire notre dépendance (pour autant que ce soit possible) par rapport aux grands moteurs de recherche du Web.

On notera aussi les modèles économiques différents qui ont été choisis pour soutenir les deux projets. Yacy est soutenu par une association allemande, alors qu’une société commerciale vient d’être créée pour Seeks. Un choix que je regrette personnellement, car je ne pense pas que ce soit le modèle approprié pour supporter des logiciels libres. Je préfère sans conteste le modèle façon Mozilla de la fondation qui créé une entreprise afin de garder la gouvernance (et les bénéfices) de cette dernière. C’est d’ailleurs possible aussi pour une simple association Loi 1901; pas la peine de sortir l’artillerie lourde de la fondation.

Pour terminer, Il y a d’autres moteurs de recherches open source comme Nutch qui est désormais un sous-projet de Lucene. A noter aussi que le standard OpenSearch définit la façon dont les résultats d’une recherche doivent être présentés.

Retrouver l’article sur Yacy.


Réagir à cet article

Article original écrit par Philippe Scoffoni le 06/12/2011. | Lien direct vers cet article

Cette création est mise à disposition sous un contrat Creative Commons BY à l'exception des images qui l'illustrent (celles-ci demeurent placées sous leur mention légale d'origine).

.

Vus : 1252
Publié par Philippe Scoffoni : 544