一、概述
- 可扩展标记语言(Extensible Markup Language)
- .XML文件是保存XML数据的一种方式,XML数据也可以以其他的方式存在(如在内存中构建XML数据),不要将XML语言狭隘地理解为XML文件
- XML通常指的是具有特定格式的字符串
- 特点
- XML具有平台无关性,是一门独立的标记语言
- 不同操作系统都可以打开XML文件(与操作系统的无关性)
- 不同的编程语言解析同一份XML文件的结果都是一样的(与编程语言的无关性)
- XML文件独立存在也是有意义的
- XML具有自我描述性
- 文件首行就是XML文档声明
- XML具有平台无关性,是一门独立的标记语言
- 作用
- 可用于网络数据传输
- 可用于数据存储
- 可用于配置文件的编写
二、XML的语法格式
1. XML文档声明
<?xml version="1.0" encoding="UTF-8"?>
2、标记(元素/标签/节点)
XML文档,由一个个的标记组成.
语法:
开始标记(开放标记): <标记名称>
结束标记(闭合标记): </标记名称>
标记名称: 自定义名称,必须遵循以下命名规则:
1.名称可以含字母、数字以及其他的字符
2.名称不能以数字或者标点符号开始
3.名称不能以字符 “xml”(或者 XML、Xml)开始
4.名称不能包含空格,不能包含冒号(:)
5.名称区分大小写
标记内容: 开始标记与结束标记之间 ,是标记的内容.
例如 ,我们通过标记, 描述一个人名:
<name>张三</name>
3、一个XML文档中, 必须有且且仅允许有一个根标记
正例:
<names>
<name>张三</name>
<name>李四</name>
</names>
反例:
<name>李四</name>
<name>麻子</name>
4、标记可以嵌套,但是不允许交叉
正例:
<person>
<name>李四</name>
<age>18</age>
</person>
反例:
<person>
<name>李四<age></name>
18</age>
</person>
5、标记的层级称呼 (子标记, 父标记 , 兄弟标记, 后代标记 ,祖先标记)
例如:
<persons>
<person>
<name>李四</name>
<length>180cm</length>
</person>
<person>
<name>李四</name>
<length>200cm</length>
</person>
</persons>
name是person的子标记.也是person的后代标记
name是persons的后代标记
name是length的兄弟标记
person是name的父标记
persons是name的祖先标记
6、标记名称允许重复
7、标记除了开始和结束 , 还有属性
- 标记中的属性, 在标记开始时 描述, 由属性名和属性值 组成
- 格式
- 在开始标记中, 描述属性可以包含0-n个属性, 每一个属性是一个键值对!
属性名不允许重复 , 键与值之间使用等号连接, 多个属性之间使用空格分割.
属性值 必须被引号引住
- 在开始标记中, 描述属性可以包含0-n个属性, 每一个属性是一个键值对!
- 举例
<persons>
<person id="10001" groupid="1">
<name>李四</name>
<age>18</age>
</person>
<person id="10002" groupid="1">
<name>李四</name>
<age>20</age>
</person>
</persons>
8、注释
-
注释不能写在文档的文档声明前
-
注释不能嵌套注释
-
格式
-
注释开始:<!--
-
注释结束:-->
-
9、语法进阶之CDATA(了解)
- CDATA 是不应该由 XML 解析器解析的文本数据
- 像 "<" 和 "&" 字符在 XML 元素中都是非法的
- "<" 会产生错误,因为解析器会把该字符解释为新元素的开始
- "&" 会产生错误,因为解析器会把该字符解释为字符实体的开始
- 某些文本ÿ
- 像 "<" 和 "&" 字符在 XML 元素中都是非法的