一、XML概述
1. 什么是XML?
XML是Extensible Markup Language即可扩展标识语言。是一种标记语言与HTML很类似。
XML没有预定义的标签,所有的标签都需要用户自行定义。XML是W3C组织发布的,目前广泛遵循的是W3C于2000年发布的XML1.0规范。XML目前已成为通用的数据交换格式在跨平台跨应用中灵活的传输数据。
2. XML的作用:
XML主要是用来描述事务的,而非是用来显示数据的。这点与HTML有很大的区别。当然也可以将XML数据进行显示。
3. XML的应用:
常作为配置文件来用。一般有两种文件可以作为配置文件。
1> .properties文件它是以key=value形式进行存储的,无法描述元素层次关系。
2> .xml文件它支持以树的层次进行存储,比较灵活。可以描述各层次之间的关系。
二、XML语法
1. XML的声明
1.1必须与<?xml开始,以?>结束,且第一句必须是XML声明,不允许在第一行注释等。
1.2 声明中有两种常用声明属性 version=”1.0”与 encoding=”utf-8”,encodeing一般使用utf-8。特别注意:若不是用IDE开发工具编写XML,比如用记事本写XML则,必须要”文件”-“另存为”为 “utf-8”的编码(当encoding=”utf-8”时)。因为一般用记事本编写的XML在保存时默认用本地默认语言gbk来保存的,而当读取时又用utf-8来读取时就乱码了。
1.3 还有个不常用的声明属性standalone表示是否单独存在不依赖其它文件,选择值为yes或者是no。
2. 元素
2.1 元素必须有开始和结束标签,比如<student>必须有</student>。
2.2 元素必须是合理嵌套,<a><b></a></b>是错误的。必须类似<a><b></b></a>。
2.3 元素必须存在且唯一存在一个根元素。XML中不会忽略空格与回车换行等。
2.4 元素名称区别大小写,且必须以字母与下划线开头,名称之间不能用空格等,不能使用:冒号等,这个是命名空间来用的。
3. 元素的属性
3.1 元素的属性必须不能重复,可以有多个。
3.2 元素的属性值必须用引用引起来,单引’’或双引””都可以。
4. 注释
与HTML中的注释是一致的,<!--注释 -->
5. CDATA区
CDATA是Character Data的缩写,它的作用是用来将特殊的字符如<、>等字符当成普通文本内容。如下面的显示
<url> <!-- 注意必须是<![CDATA[ 特殊字符串 ]]> -->
<![CDATA[
<website>www.baidu.com</website>
]]>
</url>
6. 特殊字符
如:&:& >:> <:< “:" ‘:'
7. 处理指令PI: XML的声明<?xml …就是处理指令,当然还有<?xml-stylesheettype=””..>