Articles

Publié le 24 octobre 2010 Mis à jour le 24 octobre 2010

Archiver le web, une utopie ?

Avec le développement des réseaux informatiques et de l'Internet, on est progressivement passé en une dizaine d'années d'une perception du web comme un gisement d'informations extrêmement volatiles (liens brisés, sites éphémères, contenus instables) à la vision d'un gigantesque espace informationnel où paradoxalement rien ne se perd (traçabilité numérique, présence en ligne, E-réputation).

Un web hypermnésique

Par essence la circulation des données en ligne implique de facto un ensemble de traces numériques. Ces traces ont massivement augmenté avec les innovations technologiques actuelles qui favorisent la dimension relationnelle et sociale. Ce mouvement s'inscrit plus globalement dans ce continuum perpétuel de recherche de supports matériels de la mémoire.

Les TIC ne sont pas apparues avec Internet mais remontent à quelques milliers d'années, aux temps premiers où l'humanité a ressenti le besoin d'externaliser et de stocker de la mémoire. Au cours du colloque "Mémoire et savoir : Entre Amnésie et Hypermnésie", il a été rappelé que les moteurs de recherche effectuaient, par le biais de la constitution d'un index, une forme d'archivage des sites et des pages web. Cela étant dit, comme on le sait, ce ne sont pas les seuls éléments qui sont sauvegardés puisqu'il faut y ajouter toutes les données correspondant aux profils des internautes, les parcours de navigation et autres informations plus ou moins personnelles, volontairement ou involontairement "déposées" en ligne. Pour contre-balancer ce mouvement de marchandisation du patrimoine numérique, il est apparu nécessaire d'organiser un archivage institutionnel.

Archiver le web ?

Si le pionnier en la matière a été la fondation américaine Internet Archive comme le rappelait dès 2003 Louise Merzeau dans les Cahiers de médiologie, cet organisme fondé en 1996 par Brewster Kahle ne peut pas offrir les mêmes garanties qu'un établissement public, en particulier en ce qui concerne la législation européenne relative au droit d'auteur. Rappelons à ce niveau que l'outil proposé par cette "bibliothèque digitale", à savoir Wayback machine (également accessible sur le site miroir de la Bibliotheca Alexandrina) permet de récupérer une, voire plusieurs copies de telle ou telle page web ou de tel ou tel site, sauf si on a pris les précautions techniques d'interdiction de capture automatique des contenus numériques en question.

Au cours de la décennie des années 90, plusieurs initiatives liées à la préservation de l'Internet et à l'archivage du web ont vu le jour dans de nombreux pays comme l'indique Thomas Chaimbault dans un mémoire consacré à ce sujet. Pour prendre l'exemple de la Bibliothèque Nationale de France, la BnF a pour mission de "collecter, conserver et communiquer les sites Internet du « domaine français » au titre du dépôt légal (loi 2006-961)". Plusieurs parcours guidés ( sites militants, journaux personnels, sites électoraux...) sont proposés aux usagers pour faciliter la navigation dans ces archives. A la différence du projet de Brewster Kahle, il est nécessaire de justifier sa démarche de recherche et celle-ci ne peut s'effectuer que dans les salles de lecture réservées à cet effet.

Quid des réseaux sociaux ?

Dans cette étude de Carole Daffini, l'auteure aborde la question de l'archivage des blogs d'adolescents qui, au regard du dépôt légal, sont susceptibles d'être archivés. Cette problématique n'est pas sans poser diverses questions d'ordre éthique et juridique. Certains blogueurs ou parents de jeunes surfeurs revendiquent le droit à la vie privée et à l'oubli numérique, s'opposant aux dérives potentielles d'une mémoire numérique eidétique à la manière du Funès borgésien. Cela a même été l'occasion d'ouvrir un débat sur le blog pédagogique Cicla71 désormais hébergé sur la plateforme de blogs d' Internet sans crainte. Certains acteurs de l'Internet, représentants des réseaux sociaux et autres sites ont d'ailleurs été signataires d'une charte du droit à l'oubli numérique. La grande variété des blogs peut constituer néanmoins un témoignage intéressant de la culture numérique adolescente à la fois pour leurs auteurs et les chercheurs en sciences humaines et sociales. Sur Twitter, les "gazouillis" échangés sur ce site de microblogging seront désormais archivés sur les bases de données de la Bibliothèque du Congrès (LoC), ce qui n'a pas manqué de déclencher outre-Atlantique un ensemble de réactions autour de la notion de privacy. Pour éviter, d'une certaine façon, la polémique, Lionel Maurel, auteur du blog S.I.Lex, choisit de publier ses tweets sous licence Creative Commons Zero (CC0), renonçant ainsi à tous ses droits sur les messages qu'il publie via ce réseau.

Avoir ses propres archives

Sur Figoblog, Emmanuelle Bermès indique que les archives numériques ne sont pas l'apanage des seules bibliothèques nationales. A juste titre, elle mentionne deux initiatives: L.O.C.K.S.S (Lots Of Copies Keep Stuff Safe) projet "datant de 2004 qui, via un logiciel libre, vise à permettre aux bibliothèques, dans une logique mutualiste, d'archiver de manière pérenne leurs ressources électroniques sur des sites multiples" (source: Bibliopedia) et Archive-It, service proposé par Internet Archive aux institutions n'ayant pas les moyens de mettre en place un plan d'archivage de collections numériques. Le particulier n'est pas oublié dans ce foisonnement de projets et d'applications: bon nombre de "coffres-forts numériques" ont fait leur apparition mais les solutions techniques proposées sont la plupart du temps payantes, ou gratuites mais avec un stockage assez limité.

Certaines personnes vont même plus loin en optant pour la pratique du lifelogging, comme Gordon Bell, Américain âgé de 75 ans qui "enregistre méthodiquement les méandres de son existence et conserve ces données dans d'énormes fichiers numériques" (source: Le Point).

Le temps de lire cet article, combien de pages ont été créées sur Internet ? La tâche des archivistes de notre mémoire collective numérique est sans fin.


Dossiers

  • Encyclopédies et dictionnaires


Le fil RSS de Thot Cursus - Besoin d'un lecteur RSS ? Feedly, NewsBlur


Les tweets de @Thot


Accédez à des services exclusifs gratuitement

Inscrivez-vous et recevez nos infolettres en pédagogie et technologies éducatives

Vous pourrez aussi indexer vos ressources préférées et retrouver votre historique de consultation

M’abonner à l'infolettre

Superprof : la plateforme pour trouver les meilleurs professeurs particuliers en France (mais aussi en Belgique et en Suisse)


 

Ajouter à mes listes de lecture


Créer une liste de lecture

Recevez nos nouvelles par courriel

Chaque jour, restez informé sur l’apprentissage numérique sous toutes ses formes. Des idées et des ressources intéressantes. Profitez-en, c’est gratuit !