0 前言
XML即可扩展标记语言,XML是互联网数据传输的重要工具,它可以跨越互联网任何的平台,不受编程语言和操作系统的限制,可以说它是一个拥有互联网最高级别通行证的数据携带者。
Python-基础篇: link.
1 XML语法
<?xml version="1.0" encoding="utf-8" ?>
我是徐茅山
今年20岁
男
我是李逍遥
今年22岁
男
1.1 文档申明
<?xml version="1.0" encoding="utf-8" standalone="yes" ?>
XML声明放在XML文档的第一行
version –文档符合XML1.0规范,我们学习1.0
encoding –文档字符编码,比如”gb2312”或者”utf-8”
standalone –文档定义是否独立使用。standalone=”no”为默认值。yes代表是独立使用,而no代表不是独立使用
1.2 元素和节点 element
我是徐茅山
今年20岁
男
元素包含标签tag,属性attrib(非必须)和文本text(最内侧元素才有)三要素
元素可以嵌套元素,每个XML文档必须有且只有一个根元素
标签分为开始标签和结束标签,标签必须遵守以下规范
区分大小写,
不能以数字或下划线”_”开头
不能包含空格,不能包含冒号
一个元素可以有多个属性,它的基本格式为:
<标签 属性名1="属性值1" 属性名2="属性值2">
属性值用双引号""或单引号''分隔
等号两边不能有空格
属性值不能包括<,>,&,如果一定要包含,也要使用实体字符
文本中出现的所有空格和换行,XML解析程序都会当做文本内容进行处理
具体的元素称为节点,元素是节点的类,节点是元素的实例。同一元素的节点具有相同的标签
1.3 实体字符
XML有5个预定义的实体字符,用于文本非格式语句
实体字符
说明
<
<
>
>
&
&
'
’
"
"
1.4 CDATA节
如果要传递的内容包含大量的<,>,&