1、什么是XML
XML全称Extensible Markup Language,意思是可扩展的标记语言。XML语法上和HTML比较相似,但是HTML中元素是固定的,而XML的标签是可以有用户自定义的。
W3C在1998年2月发布1.0版本,2004年2月有发布1.1版本,但是因为1.1版本不能向下兼容1.0版本,所以1.1没有人用。同时,在2004年2月W3C有发布了1.0的第三个版本。
2、XML语法
1、XML文档声明
<?xml version="1.0" encoding="UTF-8"?>
A)文档声明必须为<?xml开头,以?>结束;
B)文档必须从文档0行0列位置开始;
C)文档声明只有三个属性
-
a)version:指定XML文档版本。必须属性,因为我们不选择1.1版本,只会选择1.0;
b)encoding:指定当前文档的编码。可选属性,默认值是UTF-8;
2、元素element
<servlet>
- 元素是XML文档中重要的组成部分;
- 普通元素的结构开始标签、元素体、结束标签。例如:<hello>大家好</hello>
- 元素体:元素体:元素体可以是元素,也可以是文本,例如:<b><a>你好</a></b>
- 空元素:空元素只有开始标签,二没有结束标签,但是元素必须自己闭合,例如<c/>;
- 元素命名:
- 区分大小写
- 不能使用空格,不能使用冒号:
- 不建议以XML、xml、Xml开头;
- 格式化良好的XML文档,必须只有一个根元素;
3、属性
<web-app version="3.1">
- 属性是元素的一部分,它必须出现在元素的开始标签中
- 属性定义的格式:属性名=属性值,其中属性值必须使用单引号和双引号
- 一个元素可以有0~N个元素,但是一个元素中不能出现同名属性
- 属性名不能使用空格、冒号等特殊字符,且必须以字母开头
4、注释
XML的注释与HTML相同,即可“<!-”开始,以“->”结束,注释内容会被XML解析器忽略!
5、转义字符
XML中的转义字符和HTML一样。
因为很多符号已经被XML文档所使用,所以在元素体或属性值中想使用这些符号就必须用转义字符,例如:“<”、“>”、“’”、“””、“&”。
6、CDATA区
<![CDATA[
任意内容
]]>
在CDATA段中出现“<”、“>”、“’”、“””、“&”,都无需使用转义字符。这可以提高xml文档的可读性。当大量的转义字符出现在xml文档中四,会使xml文档的可读性大幅度降低。这时如果使用CDATA段就会好一些。
在CDATA段中不能包含“]]>”