• Home
  • Docker
  • Kubernetes
  • LLMs
  • Java
  • Ubuntu
  • Maven
  • Big Data
  • Archived
XML | Introduction
  1. Éléments, balises, textes
  2. Règles XML
  3. Règles de nommage des balises
  4. Attributs
  5. Commentaires
  6. Déclaration XML
  7. Instructions de traitement (processing instructions)
  8. Caractères d'échappement

  1. Éléments, balises, textes
    Les données dans XML sont organisées de façon hiérarchique (parent-enfants).
    Chaque élément parent du document XML peut contenir plusieurs sous-éléments enfants.
    Par conséquent, chaque élément enfant est attaché à un élément parent unique.

    Le document XML commence par un élément unique appelé la racine auquel les autres éléments, du premier niveau, doivent être liés.

    Exemple :

    Un élément est défini par une balise ouvrante (exemple "<bold>"), un contenu (exemple "Markup"), et une autre balise fermante (exemple "</bold>").
    Le nom de la balise ouvrante (exemple "<bold>") doit être le même que celui de la balise fermante correspondante (exemple "</bold>").

    La relation entre les éléments du document XML est définie comme suit :
    • L'élément "book" est le parent de l'élément "title".

    • L'élément "title" est l'enfant ou le sous-élément de l'élément "book".

    Le contenu de l'élément peut être un simple texte ou il peut être composé de d'autres éléments (y compris du texte) :
    • L'élément (racine) "book" contient un seul élément enfant :
      ► L'élément "title".

    • L'élément <title>...</title> contient trois éléments enfants :
      ► L'élément texte contenant le texte "eXtensible"
      ► L'élément "bold".
      ► L'élément texte contenant le texte "Language"

    • L'élément "bold" contient un seul élément enfant :
      ► L'élément texte contenant le texte "Markup"

    Un élément vide peut être représenté par l'une des deux syntaxes suivantes :


  2. Règles XML
    • Un document XML peut avoir un seul élément racine.

    • Chaque balise ouvrante doit avoir une balise fermante correspondante.

    • XML est sensible à la casse : le nom de la balise ouvrante doit correspondre exactement à celui de la balise fermante.

    • Les balises ne peuvent pas se chevaucher, les éléments doivent être correctement imbriqués.
  3. Règles de nommage des balises
    • Le nom d'une balise peut commencer par une lettre, mais ne peut pas commencer par un chiffre ou un caractère de ponctuation.

    • Après le premier caractère du nom de la balise, les chiffres, les tirets (-) et les points (.) sont acceptés.

    • Le nom d'une balise ne peut pas contenir le caractère deux points ":" (ce caractère est réservé pour déclarer ou référencer un espace de noms).

    • Le nom d'une balise ne peut pas contenir des espaces.

    • Il ne peut y avoir un espace entre le caractère d'ouverture "<" et le nom de la balise (exemple < book>).
      Par contre, il est possible d'avoir un espace entre le nom de la balise et le caractère de fermeture ">" (exemple <book >).
      Mais attention, les espaces ajoutés ne feront pas parties du nom de la balise (dans l'exemple précédant, le nom de la balise est "book").

    Exemples des noms de balises valides :
    • Le nom de la balise ouvrante peut se terminer par des espaces :


    • Le nom de la balise fermante peut se terminer par des espaces :


    • Le nom de la balise ouvrante/fermante peut se terminer par des espaces :


    • Le nom de la balise ouvrante/fermante peut se terminer par des espaces/saut de lignes !!! :


    • Le nom de la balise peut contenir des chiffres, des tirets (-) et des points (.) :


    Exemples des noms de balises invalides :
    • Le nom de la balise ouvrante ne peut pas commencer un espace :


    • Le nom de la balise fermante ne peut pas commencer un espace :


    • Le nom de la balise fermante ne peut pas commencer un espace :


    • Le nom de la balise ne peut pas commencer un chiffre :


    • Le nom de la balise ne peut pas contenir des espaces :


    • Le caractère (=) est illégal :

  4. Attributs
    Un élément peut avoir des attributs.
    Les attributs sont spécifiés dans la balise ouvrante de l'élément.
    Un attribut a le format suivant : ATTRIBUT_NAME="ATTRIBUT_VALUE"

    Les règles de nommage des balises s'appliquent aussi aux noms des attributs.

    Un attribut doit avoir une valeur et cette valeur doit être délimitée par les caractères : " ou '.
    Il est possible que la valeur de l'attribut soit une chaîne vide.


    Exemples des attributs invalides :
    • L'attribut "type" n'a pas de valeur :


    • La valeur de l'attribut "type" n'est pas délimitée par les caractères "" ou '' :


    • La valeur de l'attribut "type" doit être délimitée soit par les caractères "" ou '', mais pas les deux :

  5. Commentaires
    Les commentaires sont placés entre "<!--" et "-->"

    Exemples des commentaires invalides :
    • Un commentaire ne peut pas être placé à l'intérieur de la balise :


    • Un commentaire ne peut pas contenir les caractères "--" :

  6. Déclaration XML
    Exemple de déclaration XML :

    Remarques:
    • La déclaration XML n'est pas obligatoire.

    • La déclaration XML doit être la première ligne du document XML.

    • La déclaration XML commence par "<?xml" et finit par "?>".

    • L'attribut "version" est obligatoire, mais les attributs "encoding" et "standalone" sont optionnels.

    • Les attributs "version", "encoding", et "standalone" doivent être cités dans cet ordre.

    • La valeur de l'attribut "version" doit être 1.0 ou 1.1.

    Si l'attribut "standalone" est cité dans la déclaration XML, il doit avoir la valeur « yes » ou « no »:
    • « yes » : indique que le document ne dépend pas d'un autre fichier.

    • « no » : indique que le document peut dépendre d'un DTD externe.
  7. Instructions de traitement (processing instructions)
    Le document XML peut contenir des instructions spécifiques qui sont utilisées par les applications qui manipulent le document XML.
    Les instructions de traitement ne font pas partie du contenue du document XML, et sont ignorées par les applications qui ne s'en sert pas.
    Les instructions de traitement commencent par "<?" et finissent par "?>".

    Notez que la syntaxe des instructions de traitement ressemble à celle de la déclaration XML.

    Exemple d'une instruction de traitement :

  8. Caractères d'échappement
    Certains caractères sont réservés dans XML et doivent être échappés s'il faut les utiliser comme contenu des éléments (texte) :
    • &amp; représente le caractère &

    • &lt; représente le caractère <

    • &gt; représente le caractère >

    • &apos; représente le caractère '

    • &quot; représente le caractère "

    Il est possible d'utiliser le mot clés "CDATA" pour échapper les caractères.
    Tout le contenu entre "<![CDATA[" et "]]>" est ignoré et est traité tel quel.

    Il est aussi possible d'utiliser les deux méthodes suivantes pour échapper les caractères :
    • &#nnn; où "nnn" est le code décimale du caractère.
      Exemple : &#169; représente le caractère ©

    • &#xhhhh; : où "hhhh" est le code hexa décimale du caractère.
      Exemple : &#x00A9; représente le caractère ©
© 2025  mtitek