Regras de sintaxe XML
As regras de sintaxe do XML são muito simples e lógicas. As regras são fáceis de aprender e fáceis de usar.
Documentos XML devem ter um elemento raiz
Os documentos XML devem conter um elemento raiz que é o pai de todos os outros elementos:
<root>
<child>
<subchild>.....</subchild>
</child>
</root>
Neste exemplo , <note> é o elemento raiz:
<?xml version="1.0" encoding="UTF-8"?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
O prólogo XML
Esta linha é chamada de prólogo XML :
<?xml version="1.0" encoding="UTF-8"?>
O prólogo XML é opcional. Se existir, deve vir primeiro no documento.
Documentos XML podem conter caracteres internacionais, como norueguês øæå ou francês êèé.
Para evitar erros, você deve especificar a codificação usada ou salvar seus arquivos XML como UTF-8.
UTF-8 é a codificação de caracteres padrão para documentos XML.
A codificação de caracteres pode ser estudada em nosso tutorial de conjunto de caracteres .
UTF-8 também é a codificação padrão para HTML5, CSS, JavaScript, PHP e SQL.
Todos os elementos XML devem ter uma tag de fechamento
Em XML, é ilegal omitir a tag de fechamento. Todos os elementos devem ter uma tag de fechamento:
<p>This is a paragraph.</p>
<br />
Nota: O prólogo XML não possui uma tag de fechamento! Isso não é um erro. O prólogo não faz parte do documento XML.
As tags XML diferenciam maiúsculas de minúsculas
As tags XML diferenciam maiúsculas de minúsculas. A tag <Letter> é diferente da tag <letter>.
As tags de abertura e fechamento devem ser escritas com o mesmo caso:
<message>This is correct</message>
"Tags de abertura e fechamento" geralmente são chamadas de "Tags de início e fim". Use o que preferir. É exatamente a mesma coisa.
Elementos XML devem ser aninhados corretamente
Em HTML, você pode ver elementos aninhados incorretamente:
<b><i>This text is bold and italic</b></i>
Em XML, todos os elementos devem ser aninhados corretamente entre si:
<b><i>This text is bold and italic</i></b>
No exemplo acima, "adequadamente aninhado" significa simplesmente que como o elemento <i> é aberto dentro do elemento <b>, ele deve ser fechado dentro do elemento <b>.
Os valores de atributo XML devem sempre ser citados
Elementos XML podem ter atributos em pares nome/valor, assim como em HTML.
Em XML, os valores dos atributos devem sempre ser citados:
<note date="12/11/2007">
<to>Tove</to>
<from>Jani</from>
</note>
Referências de entidade
Alguns caracteres têm um significado especial em XML.
Se você colocar um caractere como "<" dentro de um elemento XML, ele gerará um erro porque o analisador o interpreta como o início de um novo elemento.
Isso gerará um erro XML:
<message>salary < 1000</message>
Para evitar esse erro, substitua o caractere "<" por uma referência de entidade :
<message>salary < 1000</message>
Existem 5 referências de entidade predefinidas em XML:
< | < | less than |
> | > | greater than |
& | & | ampersand |
' | ' | apostrophe |
" | " | quotation mark |
Apenas < e & são estritamente ilegais em XML, mas é um bom hábito substituir > por > também.
Comentários em XML
A sintaxe para escrever comentários em XML é semelhante à do HTML:
<!-- This is a comment -->
Dois traços no meio de um comentário não são permitidos:
<!-- This is an invalid -- comment -->
O espaço em branco é preservado em XML
XML não trunca vários espaços em branco (HTML trunca vários espaços em branco em um único espaço em branco):
XML: | Hello Tove |
HTML: | Hello Tove |
XML armazena nova linha como LF
Os aplicativos do Windows armazenam uma nova linha como: retorno de carro e alimentação de linha (CR+LF).
Unix e Mac OSX usam LF.
Sistemas Mac antigos usam CR.
XML armazena uma nova linha como LF.
XML bem formado
Documentos XML que estão em conformidade com as regras de sintaxe acima são considerados documentos XML "bem formados".