文章目录
一、XML概述
1、概述
XML(可扩展性标记语言)是一种常见的文件类型,主要用于存储、传输数据和配置文件,和json差不多,但是json更简单。
2 、语法
2.1、文档声明:
<?xml version="1.0"?>
'''
1、文档声明必须以<?xml开头,以?>结束,中间没有空格
2、文档声明必须从文档的0行0列位置开始
3、文档声明只有两个属性
version:指定XML文档版本。必须属性,一般使用1.0
encoding:指定当前文档的编码。可选属性,默认值为UTF-8。
'''
2.2 元素(Element)/标签(Tag)
<country name="Liechtenstein">
<rank updated="yes">2</rank>
<year>2008</year>
<gdppc>141100</gdppc>
<neighbor name="Austria" direction="E"/>
</country>
'''
1. 标签 :代码中 country、rank、neighbor均为标签,标签内可以没有属性、数据等,但是必须跟上结束标签如:</country>
2. 属性: <rank updated="yes">,属性是元素的一部分,它必须出现在元素的开始标签中,一个标签中只能出现0或者N个属性,但是不能出现多个同名属性。
3. 数据 :<year>2008</year>,2008即是XML中存储的数据(文本)
'''
二、python操作XML
xml是python内置模块,不需要额外安装,本文内容将包括对XML文件的解析、遍历、查找、增加、删除(标签、属性、数据)等内容使用的是python的xml.etree .ElementTree类。详情可见其官方文档:xml.etree .ElementTree官方文档。全文都将围绕以下的a.xml进行操作:
'''a.xml'''
<?xml version="1.0"?>
<data>
<country name="Liechtenstein">
<rank updated="yes">2</rank>
<year>2008</year>
<gdppc>141100</gdppc>
<neighbor name="Austria" direction="E"/>
<neighbor name="Switzerland" direction="W"/>
</country>
<country name="Singapore">
<rank updated="yes">5</rank>
<year>2011</year>
<gdppc>59900</gdppc>
<neighbor name="Malaysia" direction="N"/>
</country>
<country name="Panama">
<rank updated="yes">69</rank>
<year>2011</year>
<gdppc