Note : toutes les abréviations sont définies au bas de cette page
XML, eXtensible Markup Langage
Pour comprendre XML, il est essentiel de définir son environnement d’utilisation et les nombreux outils logiciels connexes à son implémentation.
XML est un langage, mais c’est aussi un des étages d’un ensemble d’outils complémentaires dont la finalité est la présentation d’une information affranchie du média de diffusion.
La définition Informatique
- XML est un Méta-langage extensible permettant de structurer des données.
- SGML est un standard international qui spécifie les règles de création des langages, indépendamment de la plate-forme et basé sur des balises.
- Les balises sont des marques utilisées dans un texte pour signaler au programme qu’une commande spécifique doit être exécutée.
Exemple : Dans «title» texte «/title», la balise «title» indique au programme de considérer ce qui la suit comme titre jusqu’à la fin de la balise «/title»)
- Une marque peut être destinée à l’identification, la description ou la mise en forme d’un élément de document.
- DTD (Document Type Definition) est une grammaire permettant de vérifier la conformité du document XML.
- La norme XML n’impose pas l’utilisation d’une DTD pour un document XML, mais elle impose par contre le respect exact des règles de base de la norme XML.
- Ils existent deux arbres DTD, un " orienté contenu " et un autre " orienté restitution " : C’est à ce niveau, que l’ordre de restitution final sera établi (par exemple, que le glossaire sera classé par thèmes alphabétiques), que les légendes seront ajoutées, que seront fabriqués automatiquement les tables des matières, les liens (logiques) de navigation, etc. Ici nous sommes encore à un niveau largement indépendant du support.
- Pour décoder un document XML, il faut un Parser qui permet d’extraire les données des balises et de les transmettre à l’application. (On parle d’analyse du document).
- La mise en page (mise en forme) des données XML est assurée par un langage de mise en page tiers ou langage de feuilles de style (CSS, XSL, XSLT).
- Par exemple : le langage normalisé de feuille de style XSL (Extensible Style Language) va permettre de spécifier comment un type de document (une DTD "orientée restitution") donné va être restitué sur un support donné. C’est à ce niveau que seront réglés les problèmes du type " saut de page ", notes présentées en bas de page ou en fin de chapitre, etc., que les liens de navigation seront fabriqués (hyperliens pour les versions informatiques, renvoi à un n° de page ou de paragraphe ou de note pour les versions papier...)
- Ici, encore, aucune des balises ne décrit la présentation finale. En revanche, les balises ont un sens et une hiérarchie. Par exemple, l’élément "Cours" comprend le titre (balise "Titre_du_Cours"), le résumé (balise "Résumè_du_cours") et l’auteur ( balise "Auteur_du_cours "). Des informations supplémentaires (Niveau d’apprentissage, publics visés, durée du cours), ont pu être ajoutées sous forme " d’attributs " situés à l’intérieur même des balises.
Abrégé d’XML
XML a déjà une riche histoire. C’est un langage mis au point en 1996 par XML Working Group sous l’égide du World Wide Web Consortium (W3C). Depuis le 10 février 1998, les spécifications XML 1.0 ont été reconnues comme recommandations par le W3C, ce qui en fait un langage reconnu.
Contrairement à HTML, qui est à considérer comme un langage défini et figé (qui présente un jeu limité de balises de représentation ), XML est considéré comme un MétaLangage permettant de définir d’autres langages, c’est-à-dire définir de nouvelles balises permettant de décrire le format des données (exemple : présentation d’un texte).
La force de XML réside dans sa capacité à pouvoir décrire n’importe quel domaine de données grâce à son extensibilité. Il va permettre de structurer, poser le vocabulaire et la syntaxe des données qu’il va contenir.
En réalité, les balises XML décrivent le contenu plutôt que la présentation (contrairement à HTML). Ainsi, XML permet de séparer le contenu de la présentation. Ce qui permet par exemple d’afficher un même document sur des applications ou des périphériques différents sans pour autant être obliger de créer autant de versions du document que l’on nécessite de représentations !
L’intérêt de disposer d’un format commun d’échange d’information dépend du contexte professionnel dans lequel les utilisateurs interviennent. C’est pourquoi, de nombreux formats de présentation de données issus des contenus XML apparaissent dans tous les domaines d’application (OFX pour la finance, MathML pour les formules mathématiques, CML pour la chimie, ).
Comme il a été dit, la philosophie du XML consiste à bien séparer les données/documents (le fichier XML proprement dit) des traitements/présentations. Un document donné sera, lors de sa création, balisé uniquement en fonction de son contenu (sa sémantique) intrinsèque et indépendamment de sa restitution future (papier, écran, terminal Braille, synthèse vocale ou autre).
Cette indépendance par rapport aux applications qui vont le traiter en général, et par rapport à celles chargées de sa restitution en particulier, va lui conférer :
- Une très grande interopérabilité (le même document XML va pouvoir être affiché sur le Web, produit en version papier, alimenter une Banque de données, ...)
- Une très grande durabilité (le document ne deviendra pas obsolète avec l’évolution des techniques informatiques ; il pourra, avec simplicité, être incorporé, en tout ou partie, dans des documents de nature très différentes, être traité/qualifié par des applications non prévues, voire inexistantes au moment de sa création).
Les principaux atouts de XML :
- Lisible et autodescriptif : aucune connaissance nécessaire pour comprendre un contenu d’un document XML
- Structure arborescente : permettant de modéliser la majorité des problèmes informatiques
- Universalité
- Déployable : il peut être facilement distribué par n’importe quels protocoles à même de transporter du texte, comme HTTP
- Intégrabilité : un document XML est utilisable par toute application pourvue d’un Parser (c’est-à-dire un logiciel permettant d’analyser un code XML)
- Extensibilité : un document XML doit pouvoir être utilisable dans tous les domaines d’applications
- Durabilité.
XML et la formation à distance
XML n’est pas un format de données, mais bien une norme qui permet de définir des formats de données, que ce soit pour des besoins propres ou pour échanger de l’information avec des tiers. XML constitue donc, une méthodologie intéressante et efficace. En effet, cette norme permet d’offrir des solutions qui sont pérennes, indépendantes des systèmes et des plates-formes, mais surtout elle permet de modéliser l’information de façon précise et souple.
La norme XML définit très peu de choses. Elle fournit une syntaxe de base pour représenter de l’information électronique, sans plus. A partir de cette syntaxe de base, des outils peuvent être développés pour traiter ces informations électroniques. On peut bien ou mal utiliser XML, on ne peut donc pas accorder des bénéfices directement à la norme, mais plutôt à sa bonne utilisation.
La formation à distance est une niche bien particulière dans ce contexte. Le mode de définition XML reste une solution équivoque pour le monde éducatif qui ne peut se satisfaire de balisages de données. Le traitement de l’information ne pourra se faire, sans prendre en compte la validation des contenus proposés, leur pertinence dans un contexte éducatif donné et leur valeur pédagogique réelle.
Toutefois, puisque XML est un standard de l’industrie, son utilisation permet de ne pas s’enfermer dans des formats ou systèmes propriétaires, ce qui est un aspect important de tout système d’information et restitution de cette information. Par conséquent, il est possible aujourd’hui de construire un système d’extraction d’information dans tous les formats possibles avec XML dont tous les aspects sont définis en fonction de normes. Ainsi, non seulement l’information est représentée d’une façon normalisée, mais aussi les traitements. Cela permet de définir le cadre d’utilisation et de représentation de l’information et ce de façon totale ou partielle.
XML permettant de modéliser plus finement des informations, le pédagogue pourra ainsi baliser et fractionner ses données pour une utilisation didactique et laisser aux acteurs de l’éducation la possibilité de contextualiser, tout ou partie et selon leur propre approche pédagogique, l’information primitive portée par XML.
Si les données étaient balisées plus finement, on pourrait facilement imaginer des outils qui permettent de les distinguer. Il y évidemment un coût, et ce coût c’est le balisage intellectuel des données.
Il est intéressant pour un pédagogue de s’intéresser à XML et ses diverses applications, car il s’agit de découvrir d’autres approches pour modéliser et traiter de l’informations didactiques. Ces découvertes peuvent l’amener à réaliser de meilleurs outils pédagogiques, mieux structurés, mais aussi d’être plus exigeant dans le choix des approches pédagogiques et dans la définition des données produites.
En conclusion
XML permet
- De saisir (ou mettre à jour) une seule fois un contenu naturel. Autrement dit :
- Sans se soucier de la présentation (mise en forme) ou des traitements futurs,
- Sans avoir à saisir des libellés tels que ’"nom", "date de naissance", sans avoir à signifier les titres (à la manière dont on saisirait une base de données.)
- Et d’en générer ensuite automatiquement :
- De multiples présentations (en tableau, en texte, en paragraphe, en banque de données)
- Avec éventuellement des tris, des sélections, des réorganisations, des générations de libellés, tables des matières, index, glossaires, etc.
Et ce sur de multiples vecteurs (écran, papier, plate-forme, terminaux spécialisés, ...)
- XML permettra aux logiciels :
- De comprendre et d’exploiter au mieux le contenu de ces pages, rendu désormais explicite par un balisage spécifique et indépendant de toute application.
L’usage d’XML pourrait dépasser largement le W3C. Il est très probable qu’il va de ce fait devenir très rapidement un langage interprété/parlé tout autant par les SGBD (Système de gestion de base de données) que par les outils de bureautique et de documentation, par les logiciels de gestion aussi bien que par les applications techniques et scientifiques. XML va rendre possible une automatisation des activités administratives et de logistiques et va considérablement simplifier l’échanges de données Informatisées et numérisées.
XML est une version simplifiée de SGML destinée aux applications Internet, qui permet aux développeurs de créer leurs propres marqueurs, pour fournir des fonctionnalités qui ne sont pas disponibles en HTML.
C’est un langage qui a la facilité de mise en oeuvre de HTML tout en offrant la richesse sémantique du SGML.
Sites de references
Définitions
XML : SGML : Tag : HTML : W3C : CSS : XSL : XSLT : DTD : OFX : MathML : CML : SGBD : | eXtensible Markup Language, ou Langage à Balise Etendu/Extensible Standard Generalized Markup Language, Un standard international (ISO 8879) Balise Hypertext Markup Language, ou langage de balisage hypertexte World Wide Web Consortium Cascading StyleSheet (langage de feuilles de style) eXtensible StyleSheet Language (langage de feuilles de style) eXtensible StyleSheet Language Transformation (langage de feuilles de style) Document Type Definition, ou Fichier de description des documents Open Financial eXchange, échanges d’informations dans le monde financier Mathematical Markup Language, représentation de formules mathématiques Chemical Markup Language, description de composés chimiques Système de Gestion de Base de donnée (ou DBMS) |
Voir plus de technologies de cette institution