LookSmart, un service de recherche sur Internet a lancé la semaine dernière un écran de veille qui utilise les ressources disponibles des ordinateurs de volontaires qui participent ainsi au projet d’indexation du contenu d’Internet.
L’écran de veille Grub a été téléchargé par 1 000 internautes et il a réalisé l’indexation de plus de 26 millions de pages web. LookSmart espère que d’autres internautes joindront le mouvement et qu’il sera possible d’indexer quotidiennement la totalité d’Internet, soit environ 10 milliards de pages. Par comparaison, Google indexe environ un tiers des pages du réseau et ses données sont mises à jour aux 30 jours selon LookSmart.
«Il s’agira du premier index intelligent (d’Internet)» a déclaré Kord Campbell, le programmeur qui a conçu l’écran de veille. Le directeur technologique de LookSmart, Andre Stechert mentionne que d’autres fonctionnalités performantes seront ajoutées au fil du temps, incluant la capacité d’indexer les pages et de réaliser une analyse des hyperliens. Et si le projet attire suffisamment de volontaires, il pourrait être en mesure d’atteindre le Saint-Graal des engins de recherche, une analyse sémantique en temps réel d’Internet.
LookSmart a l’intention de retourner à la communauté le plus d’information possible. «Nous construisons une infrastructure basée sur la communauté (des internautes), nous donnons la monnaie de la pièce» souligne Andre Stechert.
Pendant ce temps, le directeur de la qualité chez Google, Peter Norvig, déclare que le projet Grub est intéressant mais que la clef pour l’amélioration de la recherche sur le Net ne réside pas dans l’élargissement des données analysées mais plutôt sur la qualité de l’analyse. «Je ne veux pas plus d’ordinateurs sur le réseau. Je souhaite avoir plus d’information sur quelle page je dois consulter au détriment d’une autre. Le problème réside dans la façon de hiérarchiser les pages pertinentes à une recherche. Le problème pour nous est de trouver comment diriger les recherches et non pas de savoir si nous disposons des ressources nécessaires pour effectuer ces recherches.»
Pour l’article complet.