1)文档声明
需要先使用文档声明来声明XML文档
最简单的语法:
l <?xml version=“1.0” encoding=“utf-8”?>
l version版本为1.0 (代表当前xml文档的版本)
l encoding编码格式(编码格式utf-8、big5、gb2312)
l standalone是否独立(是否依靠dtd文件)默认yes
作用:告诉浏览器在解释时所采用的版本与格式等信息
2)元素(标记、标签)
l 一个标签分为起始和结束标签(不能省略)
错误:<title>三国志
正确:<title>三国志</title>
<title />
l 一个标签中可以嵌套若干子标签,但所有标签必须合理的嵌套,不允许有交叉嵌套
错误:<title><price></title></price>
正确:<title><price></price></title>
l 一个XML文档必须有且仅有一个根标签,其他标签都是这个根标签的子标签
<html>
<head></head>
</html>
元素的命名规则
l 元素(标签)的名称可以包含字母、数字、减号、下划线和英文句点
正确的:<abc></abc>
错误的:<!@#></!@#>
l 严格区分大小写;
正确的:<abc></abc>
错误的:<abc></ABC>
l 只能以字母或下划线开头;
正确的:<abc123></abc123>
错误的:<123abc></123abc>
l 名称字符之间不能有空格或制表符;
正确的:<abc></abc>
错误的:<a b c></a b c>
l 名称字符之间不能使用冒号
正确的:<abc></abc>
错误的:<ab:c></ab:c>
3)元素属性
l 一个元素可以有多个属性
l 属性值一定要用引号(单引号或双引号)引起来
l 属性名称的命名规范与元素的命名规范相同
l 元素中的属性是不允许重复的
l 标签属性所代表的信息也可以被改成用子元素的形式来描述
4)注释
基本语法:
<!--注释内容-->
注:XML声明之前不能有注释,注释不能嵌套
5)特殊字符
可以使用以下字符代替xml文档中的特殊字符
6)CDATA区段(CDATA节)
CDATA:Character Data
作用:把标签当做普通文本内容
语法:<![CDATA[内容]]>
示例代码:
对于特殊字符与CDATA区段,比较?
共同点:都是用于对特殊字符的转化
不同点:特殊字符只能用于数据量较少的情况,比如小于号、大于号等情况
CDATA区段可以用于大批量数据的转化,如文章描述、文章内容等信息