Python: XML文件解析 - minidom
使用xml.dom.minidom
解析XML的小笔记
1 读入XML文件
# 导入
import xml.dom.minidom
# 输入路径
FILE_PATH = 'example.xml'
# 打开xml文档
dom = xml.dom.minidom.parse(FILE_PATH)
# 得到文档的树根元素
root = dom.documentElement # TYPE: <DOM Element>
2 查找标签
例如节点root
的子节点包含n个标签为component
的子节点,
# root下标签名的component的子节点的列表 TYPE:<node_list>
component_list = root.getElementsByTagName('component')
假如我们知道要找的节点就是第0个,就是component_list[0]
,它的type是<DOM Element>
3 获取标签属性内容
某个component
:
<component user="user_0">
读取user
标签的内容:
# TYPE:<str>
component.getAttribute('user')
4 获取标签对之间的内容
另一个component
节点:
<component>
<apple>contents between apples</apple>
</component>
这里我们读取apple
标签对之间的内容,从component
节点出发:
component.getElementsByTagName('apple')[0].firstChild.data
输出结果(字符串型):
contents between apples