EURODL, un journal européen en ligne -
EURODL, un journal européen en ligne -
Publié le 22 septembre 2008 Mis à jour le 22 septembre 2008
Bien que Google refuse de donner des chiffres précis sur le nombre de pages Web répertoriées à ce jour, un test non officiel révèle que l’index comporterait plus d’un milliard et demi de pages Web, plus précisément 1 610 476 000 pages, depuis l’ajout d’une nouvelle fonction mise en opération à la fin du mois d’octobre permettant ainsi d’indexer des documents en formats Word, Excel, Powerpoint, RTF et Postscript.
Pour l’instant, la documentation enregistrée dans ces formats constitue une infime part des pages Web listées par Google, la majorité étant en format Html, mais ce n’est qu’une question de temps avant que les utilisateurs tirent profit de ce nouvel atout. Notons que Google fut le premier moteur de recherche à indexer des formats de fichiers autres que le format standard Html, notamment en février dernier lorsqu’il a commencé à indexer des fichiers PDF qui sont aujourd’hui au nombre de 22 millions.
Si vous souhaitez tenter l’expérience, voici comment procéder : si vous cherchez par exemple de la documentation en format Word portant sur le paysage urbain, il suffit d’inscrire dans la case de recherche de Google "paysage urbain" filetype:doc puis de lancer la recherche. Dans la liste des résultats, vous allez remarquer un lien direct vers le document Word, ainsi qu’un lien vers une version Html. Ce détail est important. Ainsi, au lieu de risquer de contaminer votre système informatique en ouvrant un document Word, vous cliquez en premier lieu sur la version Html, ce qui vous mènera sur le serveur de Google, où vous trouverez une copie du document Word libre de tout virus.
Ne vous attendez pas à ce que les titres des documents apparaissant dans la liste de résultats soient toujours pertinents. Bien qu’il soit possible de sauvegarder ces documents en formulant un titre détaillé, peu de personnes y ont accordé de l’importance jusqu’à présent. De plus, si le moteur de recherche Google ne trouve pas de titre descriptif dans le document, il extraira automatiquement un titre à partir des premières lignes du document et s’il n’arrive pas à trouver de titre, il fournira simplement l’adresse du site Web.
Il est vrai qu’il faudra un certain temps avant que les utilisateurs du Web s’adaptent à cette nouvelle fonction de recherche qui sera, souhaitons-le dans un avenir rapproché, un avantage de plus pour les usagers et les chercheurs du Web.
Accédez à des services exclusifs gratuitement
Inscrivez-vous et recevez nos infolettres en pédagogie et technologies éducatives
Vous pourrez aussi indexer vos ressources préférées et retrouver votre historique de consultation
M’abonner à l'infolettre