使用库 :import xml
安装:系统自带
示例:
如果只是配置文件尽量使用yml来读写 yml使用方法传送门
读取xml文件:
config.xml
<config>
<id>905594711349653</id>
<sec>0tn1jeerioj4x6lcugdd8xmzvm6w42tp</sec>
</config>
import xml.dom.minidom
dom = xml.dom.minidom.parse('config.xml')
root = dom.documentElement
def xml(suser):
suser = root.getElementsByTagName(suser)
return suser[0].firstChild.data
id = xml('id') # 进程名
print("打印ID:"+id)
"""
打印ID:905594711349653
"""
进阶country_data.xml
<?xml version="1.0"?>
<data>
<country name="Liechtenstein">
<rank>1</rank>
<year>2008</year>
<gdppc>141100</gdppc>
<neighbor name="Austria" direction="E"/>
<neighbor name="Switzerland" direction="W"/>
</country>
<country name="Singapore">
<rank>4</rank>
<year>2011</year>
<gdppc>59900</gdppc>
<neighbor name="Malaysia" direction="N"/>
</country>
<country name="Panama">
<rank>68</rank>
<year>2011</year>
<gdppc>13600</gdppc>
<neighbor name="Costa Rica" direction="W"/>
<neighbor name="Colombia" direction="E"/>
</country>
</data>
这里产生的 root 是一个 Element 物件,代表 XML 的根节点,每一个 Element 物件都有 tag 与 attrib 两个属性:
import xml.etree.ElementTree as ET
# 从文件加载并解析 XML 数据
tree = ET.parse('country_data.xml')
root = tree.getroot()
print(root.tag) # 打印根节点名称
print(root.attrib) # 打印根节点属性
# for 循环可以列出所有的子节点:
# 子节点与属性
for child in root:
print(child.tag, child.attrib)
"""
data
{} # data 没有属性所以返回空
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
"""
也可以使用索引的方式存取任意的节点,透过 text 属性即可取得节点的内容:
print(root[0][1].text)
"""
2008
"""
可透过 get 直接取得指定的属性值:
# 取得指定的属性值
print(root[0][3].get('name'))
"""
Austria
"""
寻找 XML 节点
iter 可以在指定节点之下,以递回方式搜索所有子节点:
# 搜索所有子节点
for neighbor in root.iter('neighbor'):
print(neighbor.attrib)
"""
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}
"""
findall 与 find 则是只从第一层子节点中搜索(不包含第二层以下),findall 会传回所有结果,而 find 则是只传回第一个找到的节点:
# 只从第一层子节点中搜索,传回所有找到的节点
for country in root.findall('country'):
# 只从第一层子节点中搜索,传回第一个找到的节点
rank = country.find('rank').text
# 取得节点指定属性质
name = country.get('name')
print(name, rank)
"""
Liechtenstein 1
Singapore 4
Panama 68
"""
修改 XML 数据
XML 节点的数据可以透过 Element.text 来修改,而属性值则可以使用 Element.set() 来指定,若要将修改的结果写入 XML 文件,则可使用 ElementTree.write():
# 寻找 rank 节点
for rank in root.iter('rank'):
# 将 rank 的数值加 1
new_rank = int(rank.text) + 1
# 设置新的 rank 值
rank.text = str(new_rank)
# 增加一个 updated 属性值
rank.set('updated', 'yes')
# 写入 XML 文件
tree.write('output.xml')
编辑之后的 XML 文件内容会像这样:
<?xml version="1.0"?>
<data>
<country name="Liechtenstein">
<rank updated="yes">2</rank>
<year>2008</year>
<gdppc>141100</gdppc>
<neighbor name="Austria" direction="E"/>
<neighbor name="Switzerland" direction="W"/>
</country>
<country name="Singapore">
<rank updated="yes">5</rank>
<year>2011</year>
<gdppc>59900</gdppc>
<neighbor name="Malaysia" direction="N"/>
</country>
<country name="Panama">
<rank updated="yes">69</rank>
<year>2011</year>
<gdppc>13600</gdppc>
<neighbor name="Costa Rica" direction="W"/>
<neighbor name="Colombia" direction="E"/>
</country>
</data>
若要移除 XML 的节点,可以使用 Element.remove():
# 在第一层子节点钟寻找 country 节点
for country in root.findall('country'):
# 取得 rank 数值
rank = int(country.find('rank').text)
# 若 rank 大于 50,则移除此节点
if rank > 50:
root.remove(country)
# 写入 XML 文件
tree.write('output.xml')
移除节点之后的 XML 文件内容会像这样:
<?xml version="1.0"?>
<data>
<country name="Liechtenstein">
<rank updated="yes">2</rank>
<year>2008</year>
<gdppc>141100</gdppc>
<neighbor name="Austria" direction="E"/>
<neighbor name="Switzerland" direction="W"/>
</country>
<country name="Singapore">
<rank updated="yes">5</rank>
<year>2011</year>
<gdppc>59900</gdppc>
<neighbor name="Malaysia" direction="N"/>
</country>
</data>
建立 XML 结构
若要建立一个全新的 XML 结构,可以使用 Element 建立根节点,再以 SubElement() 加入子节点:
# 建立新的 XML 结构
orders = ET.Element('orders')
# 新增节点
order1 = ET.SubElement(orders, 'order')
order1.text = "My Order 1"
order1.set("new", "yes")
# 新增节点
order2 = ET.SubElement(orders, 'order')
order2.text = "My Order 2"
order2.set("new", "no")
# 输出 XML 原始数据
ET.dump(orders)
<orders><order new="yes">My Order 1</order><order new="no">My Order 2</order></orders>
XPath 搜索
XPath 可以让用户在 XML 结构中以较复杂的条件进行搜索,以下是一些常见的范例。
# 顶层节点
root.findall(".")
# 寻找「顶层节点 => country => neighbor」这样结构的节点
root.findall("./country/neighbor")
# 寻找 name 属性为 Singapore,且含有 year 子节点的节点
root.findall(".//year/..[@name='Singapore']")
# 寻找父节点 name 属性为 Singapore 的 year 节点
root.findall(".//*[@name='Singapore']/year")
# 寻找在同一层 neighbor 节点中排在第二位的那一个
root.findall(".//neighbor[2]")
XML 排版
若要对一般的 XML 文件内容进行自动排版,可以使用 lxml 模组的 etree:
import lxml.etree as etree
# 读取 XML 文件
root = etree.parse("country_data.xml")
# 输出排版的 XML 数据
print(etree.tostring(root, pretty_print=True, encoding="unicode"))
# 将排版的 XML 数据写入文件
root.write("pretty_print.xml", encoding="utf-8")