XML是一种描述数据和数据结构的语言,XML数据可以保存在任何可以存储文本的文档之中,读文档可以是真实的或虚拟的文件、数据流或者其他存储媒介。一个正确的XML文档以下面的XML声明作为开始,表示该文当时一个XML文档,并且指出该文档内容所遵从的XML版本号:
<?xml version="1.0"? >
XML声明中还包括一个encoding属性,指明文档内容所使用的字符编码类型。例如,下面的声明指定该文档中所包含的字符类型是Windows95、98和ME中使用的Latin-1字符集:
<?xml version="1.0" encoding="ISO-8859-1"?>
下一例子标示字符类型为UTF-16,该字符类型是16位Unicode字符:
<?xml version="1.0" encoding="UTF-16"?>
XML解释器可根据文档前的5个字符(<?xml)推断出编码方式,故encoding属性是可选的。
XML声明后紧跟着的是文档的根元素,根元素通常被称为文档元素(document element)。如下实例的根元素命名为Guitars:
<?xml version="1.0"? >
<Guitars>
................
</Guitars>
根元素是不可选的,每个文档中必须要包含一个。下面的XML是合法的,因为Guitar元素嵌入在文档元素Guitars内:
<?xml version="1.0"? >
<Guitars>
<Guitar>
...............
</Guitar>
<Guitar>
...............
</Guitar>
</Guitars>
下面的例子是不合法的一位他缺少文档元素:
<?xml version="1.0"? >
<Guitar>
...............
</Guitar>
<Guitar>
...............
</Guitar>
元素名的命名要遵守XML1.0的规则,可以包含字母、阿拉伯数据、句点、连接符和下划线,不能包含空格。