« retourner à la page principale du blog
Introduction au XML
Si vous n’avez pas encore touché à du XML, c’est un langage qui peut faire peur, étant donné qu’il est associé à des usages qui semblent plutôt avancés. Sur le web, on l’utilise entre autres pour le AJAX, pour les feeds (RSS, Atom) et pour les services web. Pourtant, lorsqu’on décide d’y jeter un oeil, il n’est vraiment pas si compliqué.
Exemple de code
<?xml version="1.0" encoding="UTF-8"?>
<library>
<book>
<title>Interview with the Vampire</title>
<author>Ann Rice</author>
<year>1976</year>
</book>
<book>
<title>American Psycho</title>
<author>Bret Easton Ellis</author>
<year>1991</year>
</book>
</library>
La déclaration XML
Les documents XML devraient commencer par la déclaration XML, c’est-à-dire:
<?xml version="1.0" encoding="UTF-8"?>
Il ne devrait pas y avoir de caractère avant la déclaration (même pas un espace). On peut aussi spécifier l’encodage utilisé. Les deux encodages supportés de manière obligatoires sont UTF-8 et UTF-16. Les version XML qui existent présentement sont 1.0 et 1.1.
Les étiquettes et les éléments
Les étiquettes (tags) et les éléments (elements) sont ce qui compose le document XML. Dans l’exemple plus haut, book et title sont des tags. Ces tags démarquent le début et la fin des éléments. <author>Ann Rice<author> est un élément (incluant le tag d’ouverture et de fermeture).
La syntaxe est la même qu’en HTML: il faut toujours fermer les tags qu’on ouvre avec le même tag, qui commence par un « / ». Exemple: <year>1976</year>. Aussi, il ne faut pas que les tags se croisent: <a><b>1976</a></b> est invalide.
Un seul élément racine
Dans notre exemple, l’élément racine (root element) est délimité par les tags <library>. En XML, il ne doit y avoir qu’un seul élément racine. Si je devais avoir plus d’un <library>, je devrais les encapsuler dans un autre tag.
Les attributs
Comme en HTML, on peut mettre des attributs à l’intérieur des tags. Exemple:
<c b="x">Arthur</c>
Les attributs doivent être dans le tag d’ouverture, avec la syntaxe nom="valeur". N’oubliez pas les guillemets.
Caractères spéciaux (références)
En XML, le caractère & est réservé pour les références. Les références sont, comme en HTML, pour représenter des caractères spéciaux. Par exemple, < est représenté par <. Contrairement au HTML, les seuls codes spéciaux en XML sont:
- & → &
- < → <
- > → >
- » → "
- ‘ → '
Les autres caractères comme « é » (é n’existant pas en XML) sont représentés par é, c’est à dire, &# suivit du numéro de caractère unicode, et de ;.
Avec la version 1.1 du XML, à moins que je me trompe, les caractères spéciaux n’ont pas besoin d’être référencés et peuvent être écrits directement dans le document, sauf pour les 5 caractères listés plus haut.
Quelques liens
- Spécifications du XML 1.0
- Spécifications du XML 1.1
- Articles du XML sur Wikipedia
- Tutoriels de W3Schools

5 novembre 2008 à 23:04
bon article, mais c’est pas Wikiperdia, mais Wikipedia !
5 novembre 2008 à 23:18
Haha, c’est bon, je corrige ça à l’instant.