Revue électronique internationale en Technologie de l’Information***
La revue est destinée aux chercheurs et industriels pour la promotion et la diffusion des résultats de recherches et des expériences R&D dans le domaine des TI au Nord et au Sud.
Publié le 16 mars 2008 Mis à jour le 16 mars 2008
Dans un article intitulé Le livre est une base de données publié sur le blog LaFeuille, Hubert Guillaud réfléchit à l’avenir du livre numérique et au formidable potentiel des outils de traitement des données appliqués aux contenus littéraires. Son article, long et complexe, est en fait le développement d’un diaporama disponible ici.
Guillaud part du constat suivant : aujourd’hui, les livres disponibles sur le web se présentent sous forme de fichiers textes, accompagnés de quelques métadonnées qui permettent d’accéder à leur fiche descriptive (auteur, titre, éditeur, année du publication), et d’outils autorisant des recherches en plein texte, par exemple pour relever l’occurrence d’un terme. Mais c’est à peu près tout.
Guillaud se prend à rêver : et si les éditeurs rendaient accessibles les livre numériques sous forme de bases de données ?
Il rappelle qu’une base de données est un ensemble de « champs de contenus qui discutent entre eux ». Pour passer du statut d’oeuvre linéaire et finie à celui de base de données, le livre devrait être découpé, « haché » en une multitude de données reconnues par les applications informatiques qui donneraient au lecteur un accès considérablement enrichi au contenu.
Par exemple, il deviendrait possible de regrouper sur une seule page toutes les apparitions d’un personnage de roman ; toutes les notes de bas de page ; tous les mots relevant d’un champ lexical donné (et pas seulement les occurrence d’un mot).
Le livre serait bien entendu connecté à des données externes. Ainsi, on peut imaginer qu’à partir de la mention d’un lieu dans un livre, on puisse accéder à une banque de photographies de ce lieu ; ou même au carnet de note en ligne dans lequel l’écrivain décrit sa visite en ce lieu.
De même, tout mot décrivant un concept (le bonheur, la pauvreté, la science) ouvrirait la possibilité de naviguer vers d’autres ouvrages traitant du même concept, sous des formes différentes.
Plus simplement, le lecteur aurait la possibilité de « tagger » des extraits du livre et d’agréger tous les passages portant ce tag. Ou encore de se confectionner un "pot pourri" de ses passages préférés dans l’oeuvre d’un auteur.
Guillaud décrit ainsi une foule de possibilités, en s’appuyant sur des outils de traitement des données déjà disponibles ou en développement.
Guillaud termine son exposé par un appel aux bibliothécaires, les encourageant à réaliser des expérimentations collectives sur les nouveaux chemins d’accès au savoir et aux contenus littéraires, pour mieux se conformer aux usages d’ores et déjà établis des lecteurs.
Une réflexion stimulante, et une invitation à effectuer un beau parcours parmi les sites d’édition les plus novateurs.
Le livre est une base de données
Accédez à des services exclusifs gratuitement
Inscrivez-vous et recevez nos infolettres en pédagogie et technologies éducatives
Vous pourrez aussi indexer vos ressources préférées et retrouver votre historique de consultation
M’abonner à l'infolettre