xml文件内容如下:
<?xml version="1.0" encoding="utf-8"?>
<catalog>
<maxid>4</maxid>
<login username="pytest" passwd='123456'>
<caption>Python</caption>
<item id="4">
<caption>测试</caption>
</item>
</login>
<item id="2">
<caption>Zope</caption>
</item>
</catalog>
读取文件获得标签属性
import xml.dom.minidom
#打开xml文档
dom = xml.dom.minidom.parse('abc.xml')
#得到文档元素对象
root = dom.documentElement
print(root.nodeName)
print(root.nodeValue)
print(root.nodeType)
print(root.ELEMENT_NODE)
输出
catalog
None
1
1
mxl.dom.minidom 模块被用来处理xml文件,所以要先引入。
xml.dom.minidom.parse() 用于打开一个xml文件,并将这个文件对象dom变量。
documentElement 用于得到dom对象的文档元素,并把获得的对象给root
每一个结点都有它的nodeName,nodeValue,nodeType属性。
nodeName为结点名字。
nodeValue是结点的值,只对文本结点有效。
nodeType是结点的类型。catalog是ELEMENT_NODE类型
获得catalog的子标签
import xml.dom.minidom
#打开xml文档
dom = xml.dom.minidom.parse('abc.xml')
#得到文档元素对象
root = dom.documentElement
id = root.getElementsByTagName('maxid')[0]
print(id.nodeName)
输出maxid
如何区分相同标签名字的标签:
例如b=root.getElementsByTagName(‘caption’) 获得的是标签为caption 一组标签,b[0]表示一组标签中的第一个;b[2]表示这一组标签中的第三个。
获得标签属性值
例如<login>和<item>
标签是有属性的,如何获得他们的属性?
getAttribute方法可以获得元素的属性所对应的值。
import xml.dom.minidom
#打开xml文档
dom = xml.dom.minidom.parse('abc.xml')
#得到文档元素对象
root = dom.documentElement
id = root.getElementsByTagName('maxid')[0]
print(id.nodeName)
user=root.getElementsByTagName('login')[0]
name=user.getAttribute("username")
print(name)
输出pytest
获得标签对之间的数据
firstChild 属性返回被选节点的第一个子节点,.data表示获取该节点人数据。
import xml.dom.minidom
#打开xml文档
dom = xml.dom.minidom.parse('abc.xml')
#得到文档元素对象
root = dom.documentElement
cap=root.getElementsByTagName('caption')[0]
cap=cap.firstChild.data
print(cap)
输出Python