1.XML概述
XML:XML一种数据存储格式,这种数据存储格式在存储数据内容的同时,还能够保存数据之间的关系
XML保存数据的方法:XML利用标签来保存数据的内容,利用标签之间的嵌套关系来保存数据之间的关系。
XML的应用场景:
1.利用XML跨平台的特性,用来在不同的操作系统不同的开发语言之间传输数据。如果说java是一门跨平台的语言,那XML就是跨平台的数据。
2.利用XML可以保存具有关系的数据的特性,还常常被用来做为配置文件使用。
XML文件:把XML格式的数据保存到文件中,这样的文件通常起后缀名为.XML,这样的文件就叫做XML文件,XML文件是XML数据最常见的存在形式,但是,这不是XML的唯一存在形式(在内存中或在网络中也可以存在),不要把XML狭隘的理解成XML文件。
XML校验:浏览器除了内置html解析引擎外还内置了XML解析器,利用浏览器打开XML格式的数据,就可以进行XML校验。
2.XML语法
文档声明:一个格式良好的XML必须包含也只能包含一个文档声明,并且文档声明必须出现在XML文档第一行,其前不能有其他任何内容。
<?XML version="1.0" encoding="gb2312" ?>
其中的version代表当前XML所遵循的规范版本,encoding属性指定文档所使用的字符集编码。
注意:(1) encoding属性指定的编码集和XML真正使用的编码应该一致,如果不一致就会有乱码问题。
(2) encoding属性默认值为老外喜欢的iso8859-1。
元素:元素分为开始标签和结束标签,在开始标签和结束标签之间的文本称为标签体,如果一个标签即不含标签体也不包含其他标签,那这样的标签可以把开始标签和结束标签进行合并,这样的标签叫自闭标签。
<a>xxxxx</a> <a/>
*一个格式良好的XML文档应该具有并且只能有一个根标签,其他标签都应该是这个跟标签的子孙标签。
元素的命名规范:
(1) 区分大小写,例如,<P>和<p>是两个不同的标记。
(2)不能以数字或标点符号或"_"开头。
(3)不能以XML(或XML、或Xml 等)开头。
(4)不能包含空格。
(5)名称中间不能包含冒号。
属性:
(1) 一个元素可以包含多个属性,属性的值要用单引号或双引号括起来。如果属性的之中包含双引号,就要用单引号了。
(2)属性的命名规范,参照元素的命名规范。
注释:
<!--这是一段注释-->
注意:
(1)注释不能出现在文档声明之前。实验:把注释写到文档声明之前,用ie打开是没问题,但是用chrome打开是报错的。这就看出来了不同的解析器有不同的处理。
(2)注释不能嵌套注释。
*CDATA区、转义字符:都可以用来转义特殊字符。
CDATA区 : <![CDATA[这是要转义的内容]]>
CDATA是不会被解析器解析的内容。被CDATA区扩起来的内容,将会被浏览器当作文本来处理。
转义字符:
& --> &
< --> <
> --> >
" --> "
' --> '
CDATA区和转义字符的区别
(1)CDATA区可以成段的进行转义,而转义字符一次只能转义一个字符
(2)CDATA区转义的字符可以保存数据本来的格式只是通知解析器按文本去处理。转义字符改变了数据本身的内容,利用其他字符替代了转义字符。
处理指令:一段指令通知解析器以何种方式解析XML。
<?XML-stylesheet type="text/css" href="1.css" ?>指定解析器使用1.css去渲染当前的XML数据
其实文档声明就是一个最常见的处理指令。
3.XML解析