XML的基本语法
1.文档声明
(1)最简单的声明语法:
<?xml version="1.0" ?>
(2)用encoding属性说明文档的字符编码
<?xml version="2.0" encoding="GB2312" ?>
(3)用standalone属性说明文档是否独立:
<?xml version="1.0" encoding="GB2312" standalone="yes" ?>
2.元素定义
(1)一个XML元素由一个标记来定义,包括开始和结束标记以及其中的内容,例如:
<书名>JAVA详解</书名>
(2)一个元素中可以嵌套若干子元素。
(3)格式良好的XML文档必须有且仅有一个根元素,其他元素都是这个根元素的子孙元素。
(4)空元素可以不使用结束标记,但必须在起始标记的结束定界符(>)前面增加一个正斜杠(/),例如:
<img src="logon.jpg" />
(5)所有的元素都必须合理的嵌套,绝对不允许标签交叉,例如:
<b>sdfsdeee<i>sdfsdf</b></i>
(6)元素的标记名称规范
3.属性定义
(1)一个标签可以有多个属性,每个属性都有它自己的名称和取值,例如:
<售价 单位="元">58</售价>
(2)属性值一定要用双引号(")或单引号(')引起来
(3)属性遵循与标签相同的命名规范
(4)属性可以被改成用子元素来描述同样的信息
<售价>
<单位>元</单位>
<价格>58</价格>
</售价>
4.注释
(1)用“<!--注释-->”正中格式加入注释
(2)用XML声明之前不能有注释
(3)一对注释符号之中不能包含另一对注释符号。
5.空格和换行的处理
(1)对于XML中的标签以外的所有空格和换行,XML解析程序都要一个个如实地交给下游程序去处理。
6.CDATA区
(1)XML文档中包含类似"Elemets look like <this>"的文本,其中的"this"将解析程序解释成一个元素,而人们实际想要的是"<this>"所表示的原义文本。
(2)CDATA全称为character data,以“<![CDATA[”开始,以“]]>”结束,在两者之间嵌入不想被解析程序解析的原始数据,解析器不对CDATA区中的内容进行解析,而是将这些数据原封不动地交给下游程序去处理。
7.特殊字符
(1)&转成&<转成<>转成>"转成";'转成&apos;
8.处理指令
(1)处理指令是processing instruction的中文翻译,通常简称PI,用来为处理XML文档的应用程序提供指示信息。
(2)处理指令以"<?"作为开头,以"?>"作为结尾,XML声明语句就是最常见的一种处理指令。
(3)XML分析器把处理指令原封不动地传给应用程序,由应用程序来解析这个指令,按照它所提供的信息来进行处理。例如,在某个XML文档中可以包含下面的语句来告诉浏览器使用book.css控制其显示效果:
<?xml-stylesheet type="text/css" href="book.css" ?>