一个XML文件包含以下一个内容:
- 文档声明
- 元素
- 属性
- 注释
- CDATA区,特殊字符
- 处理指令
- 1:声明
-
l 在编写 XML 文档时,需要先使用文档声明,声明 XML 文档的类型。l 最简单的声明语法:
<?xml version="1.0" ?>
l 用 encoding 属性说明文档的字符编码:<?xml version="1.0"encoding="GB2312" ?>
l 用 standalone 属性说明文档是否独立:<?xml version="1.0"encoding="GB2312" standalone="yes" ?>
2:元素 -
l XML 元素指 XML 文件中出现的标签,一个标签分为开始标签和结束标签,一个标签有如下几种书写形式,例如:• 包含标签体: <a>llhc.edu.com</a>• 不含标签体的: <a></a>, 简写为: <a/>l 一个标签中也可以嵌套若干子标签。但所有标签必须合理的嵌套,绝对不允许交叉嵌套,例如:
<a>welcome to<b>www.it315.org</a></b>
l 格式良好的 XML 文档必须有且仅有一个根标签,其它标签都是这个根标签的子孙标签。 -
l 对于 XML 标签中出现的所有空格和换行, XML 解析程序都会当作标签内容进行处理。例如:下面两段内容的意义是不一样的。
第一段:
<网址>www.baidu.com</网址>
第二段:
<网址>
www.baidu.com
</网址>
-
l 由于在 XML 中,空格和换行都作为原始内容被处理,所以,在编写 XML 文件时,使用换行和缩进等方式来让原文件中的内容清晰可读的“良好”书写习惯可能要被迫改变。
-
l 一个 XML 元素可以包含字母、数字以及其它一些可见字符,但必须遵守下面的一些规范:l 区分大小写,例如, <P> 和 <p> 是两个不同的标记。l 不能以数字或 "_" ( 下划线 ) 开头。l 不能以 xml( 或 XML 、或 Xml 等 ) 开头。l 不能包含空格。l 名称中间不能包含冒号( : )。3:属性
-
l 一个标签可以有多个属性,每个属性都有它自己的名称和取值,例如:
<input name=“text”>
l 属性值一定要用双引号( " )或单引号( ' )引起来l 定义属性必须遵循与标签相同的命名规范l 多学一招:在 XML 技术中,标签属性所代表的信息,也可以被改成用子元素的形式来描述,例如:<input>
<name>text</name>
</input>
-
4:注释
-
l Xml 文件中的注释采用:“ <!-- 注释 -->” 格式。l 注意:• XML 声明之前不能有注释• 注释不能嵌套,例如:
<!--大段注释
……
<!--局部注释-->
……
-->
5:CDATA区 -
l 在编写 XML 文件时,有些内容可能不想让解析引擎解析执行,而是当作原始内容处理。l 遇到此种情况,可以把这些内容放在 CDATA 区里,对于 CDATA 区域内的内容, XML 解析程序不会处理,而是直接原封不动的输出。l 语法: <![CDATA[ 内容 ]]>
<![CDATA[
<cullinans>
<br/>
</cullinans>
]]>
转义字符:l 对于一些单个字符,若想显示其原始样式,也可以使用转义的形式予以处理。 -
6:处理指令
-
l 处理指令,简称 PI ( processing instruction )。处理指令用来指挥解析引擎如何解析 XML 文档内容。ll 例如,在 XML 文档中可以使用 xml- stylesheet 指令,通知 XML 解析引擎,应用 css 文件显示 xml 文档内容。 <?xml- stylesheet type="text/ css " href ="1.css"?>l处理指令必须以“ <?” 作为开头,以“ ?>” 作为结尾, XML 声明语句就是最常见的一种处理指令