Introduction à (X)HTML

Pour publier des informations pouvant être lues dans le monde entier, il faut utiliser un langage que tous les ordinateurs soient susceptibles de comprendre. Le langage utilisé par le World Wide Web est le HTML (HyperText Markup Language). Un document HTML est d'abord un texte. Mais c'est un texte avec des indications sur l'articulations logique du document, comme savoir ce qui est un titre, une définition, etc (Markup). Il n'a pas une structure linéaire comme les textes imprimés classiques, il permet, à travers des liens, de sauter d'une partie du document à une autre voire à d'autres documents (HyperText). Il permet aussi d'inclure d'autres types de contenus comme des images, des videos, des applications. Le logiciel utilisé pour décoder le HTML et l'afficher à l'écran s'appelle un navigateur (Internet Explorer, Firefox, Safari...).

Le HTML est apparu dans les années 1990. Il est rapidement devenu populaire, notamment grâce au navigateur Mosaic, et de nombreuses modifications au langage de base ont été apportées. Le premier vrai standard est apparu en 1995 et porte le nom HTML 2.0. Il a évolué depuis pour aboutir en 1999 au HTML 4.01, dernière version en date.

Le HTML a une syntaxe très permissive. C'est pratique pour le débutant qui crée une page web, il va toujours avoir un résultat, même si ce n'est pas forcément exactement celui qu'il souhaitait. Ce n'est cependant pas du tout adapté à un traitement automatique. On souhaite aujourd'hui accéder à ces pages sur d'autres supports que de gros ordinateurs, comme des téléphones portables, et ces supports n'ont pas les moyens de gérer le HTML. En 2000 a donc été créé un nouveau langage, le XHTML (Extensible HyperText Markup Language). C'est le successeur naturel du HTML, avec lequel il est assez largement compatible. Il peut être vu comme un croisement du HTML avec le XML (Extensible Markup Language), deux sous-ensemble du SGML (Standard Generalized Markup Language). Pour caricaturer, la différence qu'apporte le XHTML est que quand on ouvre une parenthèse, il faut la refermer, et que quand on a mis ses chaussettes avant ses chaussures, il faut retirer ses chaussures avant de retirer ses chaussettes. Il permet d'autre part de définir beaucoup plus facilement des extensions (comme un langage de description de formules mathématiques complexes : MathML, un autre de description de figures : SVG, etc). Nous allons donc apprendre le XHTML de préférence au HTML.

L'organisme chargé de rédiger les standards concernant le WWW est le W3C. Vous trouverez sur leur page toutes les normes, et des validateurs permettant de vérifier si vos pages sont conformes aux normes.

Valid XHTML 1.0 Strict