目录
XML
XML概述
- XML可扩展标记语言。
- 允许开发者自由定义标签,可以将标签和内容有效分离。
- XML不再侧重于数据如何展示,而是更多的关注数据如何存储和传输。
XML的应用场景
- XML把数据从HTML分离出来
- 简化数据共享
- 简化数据的传输
- 简化平台的变更
XML的优势
- 简单易用的标记语言
- 严格的格式
- 数据逻辑和显示逻辑分离
<?xml version="1.0" encoding="UTF-8"?>
<teaching-plan attribute="教学计划">
<course attribute="课程">
<course-name attribute="课程名">大学英语</course-name>
<class-hour attribute="课时">36</class-hour>
<exam-form attribute="考核方式">考试</exam-form>
</course>
<course attribute="课程">
<course-name attribute="课程名">高等数学</course-name>
<class-hour attribute="课时">70</class-hour>
<exam-form attribute="考核方式">考试</exam-form>
</course>
<course attribute="课程">
<course-name attribute="课程名">计算机应用基础</course-name>
<class-hour attribute="课时">108</class-hour>
<exam-form attribute="考核方式">上机考试</exam-form>
</course>
</teaching-plan>
XML的整体结构
- 有且只有一个根元素
- 元素必须合理结束
- 元素之间必须合理嵌套
- 元素的属性必须有值
XML声明
<?xml version=“1.0 encoding=“GB2312” standalone="yes"?>
字符集
- 简体中文:GBK或GB2312
- 繁体中文BIG5
- 西欧字符ISO8859-1
- 通用的国际编码 Unicode
- 针对 Unicode的可变长度字符编码:UTF8
XML元素的基本规则
1.合法标签名
- XML元素由开始标签和结束标签组成,结束标签比开始标签多一条斜线
- XML文档区分大小写,因此,开始标签和结束标签必须绝对相同,大小写也要完全一致
- XML文档对于标签名有如下要求:
- 标签名可以字母(包括非西欧字符)、数字、下画线(_)、中画线(一)、冒号(:)和点号(.)组成,但不能以数字、中画线和点号开头
- ·标签名不能包括<、>、,、$等符号
- ·标签名中尽量不要出现英文冒号:,除非是在使用名字空间
- 标签名不能以字符“xml"(或者XML、Xml等任意大小写组合开始)
- 标签名不能包含空格
2.嵌套子元素
- XML允许无限深度嵌套子元素,只要保证元素之间合理嵌套即可
- XML元素可以嵌套多个重名的子元素,这多个元素之间是有序的
3.空元素
- XML允许使用空元素语法,空元素不可接受子元素,也不可接受字符串内容
- 空元素和内容为空的元素并不相同
- 空元素只是不能包含子元素,也不能包含字符串内容,但完全可以接受属性而且可以接受任意多个属性
字符数据
- 开始标签和结束标签之间的文本可以是任何Unicole字符,并且其间的任何字符都将忠实地传递给XML处理程序
- 如果文本字符串中包含一些特殊的字符,例如尖括号(<)或and符号(&)由于这些符号在XML文档中都有特殊的含义,因此直接在XML元素中使用该字符串将引起文档混乱
1.使用实体引用
为了正确处理XML文档中的特殊字符,ⅩML允许使用实体来表示这些特殊字符。
XML预置了5个实体引用,如表
2.使用 CDATA标记
在特殊标记 CDATA下,所有的特殊字符,甚至是有效的元素都将被当成简单字符处理实体引用也会失去作用,变成纯文本
语法:
<! [CDATA[文本内容]]>
注释<