Comment traduire en quelques mots-clés ce que l'on cherche sur Internet ? Certes, les moteurs de recherche tels que Google et Yahoo fournissent désormais des suggestions, mais l'on peut néanmoins tâtonner longtemps avant de dénicher les ressources pertinentes.
Voici un moteur de recherche qui devrait grandement faciliter non seulement l'identification des ressources, mais qui offre en outre une vision générale des sous-thématiques (les clusters) associées à la thématique générale.
Regrouper les résultats en catégories
Lingo3G est en effet un méta-moteur de recherche basé sur l'application Carrot search (en open source). Il vous permet d'effectuer une recherche dans le web général, mais vous pouvez également spécifier l'espace de recherche souhaité : images, Wikipedia, nouvelles, etc.
La liste des 100 premiers résultats est accompagnée de deux types de visualisation :
- Une arborescence qui classe les résultats selon leur sujet principal, obtenu par repérage de mots-clés dans les documents;
- Un diagramme circulaire coloré, segmenté en fonction des mots-clés.
Le regroupement des résultats en sous-thématiques constitue le principal attrait de cette application; il est en effet possible ensuite de restreindre, grâce aux mots-clés indiqués, la recherche à des aspects particuliers du sujet considéré. En cliquant sur l'une des catégories, on voit alors apparaître la liste des résultats correspondants.
On notera malgré tout que les regroupements réalisés ne sont pas tous pertinents : il suffit qu'une expression linguistique banale apparaisse fréquemment dans plusieurs documents pour qu'elle se transforme en sous-thématique. De plus, la catégorisation n'est opérée que sur les 100 premiers résultats; ceci, afin de conserver une rapidité suffisante à l'extraction des résultats, puisque la recherche de mots-clés s'effectue en temps réel.
L'application Open Source
Lingo3G est utilisable en ligne et fonctionne alors avec l'API de Yahoo. Mais est également disponible en téléchargement gratuit, sous le nom de Carrot 2, pour être implémenté sur des moteurs de recherche existants. Il dote alors ces moteurs de quatre capacités fondamentales :
- la catégorisation des résultats de recherche
- l'exploration visuelle des données de recherche
- l'optimisation des recherches
- l'extraction des mots-clés.
Comparé à d'autres outils du genre, Lingo3G offre peu d'options de représentation graphique. Mais les deux représentations proposées permettent déjà d'améliorer grandement les recherches de base.
En ligne : Lingo 3G
Télécharger : Lingo 3G du projet Open Source Carrot 2
Voir plus de technologies de cette institution