python 读取xml文件

首先,获得标签信息abc.xml

<?xml version="1.0" encoding="utf-8"?>
<catalog>
    <maxid>4</maxid>
    <login username="pytest" password="123456">
        <caption>Python</caption>
        <item id="4">
            <caption>Testing</caption>
        </item>
    </login>
    <item id="2">
        <caption>Zope</caption>
    </item>

</catalog>

python获取catalog标签的信息

# -*- coding:utf-8 -*-

import xml.dom.minidom

# 打开xml文档
dom = xml.dom.minidom.parse('abc.xml')

# 得到文档元素对象
root = dom.documentElement
    print root.nodeName
    print root.nodeValue
    print root.nodeType
    print root.ELEMENT_NODE

xml.dom.minidom 模块被用来处理xml文件

parse():用于打开一个xml文件

documentElement:用于得到dom对象的文档元素,并将获得的对象给root,每一个结点都有它的nodeName,nodeValue,nodeType属性

nodeName:结点名字

nodeValue:结点值,只对文本结点有效

nodeType:结点类型

二、获得子标签:

<maxid>
<login>
import xml.dom.minidom

dom = xml.dom.minidom.parse('abc.xml')

root = dom.documentElement

bb = root.getElementsByTagName('maxid')
bb = bb[0]
print bb.nodeName

bb = root.getElementsByTagName('login')
bb = bb[0]
print bb.nodeName

三、区分相同标签名字的标签

<caption>
<item>
import xml.dom.minidom

# 打开xml文档
dom = xml.dom.minidom.parse('abc.xml')

# 得到文档元素对象
root = dom.documentElement

aa = root.getElementsByTagName('caption')
a = aa[2]
print a.nodeName

aa = root.getElementsByTagName('item')
a = aa[1]
print a.nodeName

root.getElementsByTagName('caption')获得的标签是caption一组标签

四、获得标签的属性值

username="pytest" password="123456"
id="4"
id="2"
import xml.dom.minidom

# 打开xml文档
dom = xml.dom.minidom.parse('abc.xml')

# 得到文档元素对象
root = dom.documentElement

#  获取标签的属性值
itemlist = root.getElementsByTagName('login')
item = itemlist[0]
un = item.getAttribute('username')
print un

pd = item.getAttribute('password')
print pd

ii = root.getElementsByTagName('item')
i1 = ii[0]
i = i1.getAttribute('id')
print i

i2 = ii[1]
i = i2.getAttribute('id')
print i

五、获得标签对之间的数据

 <caption>Python</caption>
 <caption>Testing</caption>
<caption>Zope</caption>
import xml.dom.minidom

# 打开xml文档
dom = xml.dom.minidom.parse('abc.xml')

# 得到文档元素对象
root = dom.documentElement

cc = dom.getElementsByTagName('caption')
c1 = cc[0]
print c1.firstChild.data

c2 = cc[1]
print c2.firstChild.data

c3 = cc[2]
print c3.firstChild.data

 

转载于:https://www.cnblogs.com/xiaobucainiao/p/6184443.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值