python xml.dom模块解析xml

23 篇文章 0 订阅

python xml.dom模块解析xml

  1. 什么是xml?有何特征?
    xml即可扩展标记语言,它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。

例子:del.xml

<?xml version="1.0" encoding="utf-8"?>
<catalog>
    <maxid>4</maxid>
    <login username="pytest" passwd='123456'>
        <caption>Python</caption>
        <item id="4">
            <caption>test</caption>
        </item>
    </login>
    <item id="2">
        <caption>Zope</caption>
    </item>
</catalog>

从结构上,很像HTML超文本标记语言。但他们被设计的目的是不同的,超文本标记语言被设计用来显示数据,其焦点是数据的外观。它被设计用来传输和存储数据,其焦点是数据的内容。

那么它有如下特征:

它是有标签对组成,
标签可以有属性:
标签对可以嵌入数据:abc
标签可以嵌入子标签(具有层级关系)
2. 获得标签属性

#coding: utf-8
import xml.dom.minidom
dom = xml.dom.minidom.parse("del.xml")  #打开xml文档

root = dom.documentElement              #得到xml文档对象
print "nodeName:", root.nodeName        #每一个结点都有它的nodeName,nodeValue,nodeType属性
print "nodeValue:", root.nodeValue      #nodeValue是结点的值,只对文本结点有效
print "nodeType:", root.nodeType
print "ELEMENT_NODE:", root.ELEMENT_NODE

nodeType是结点的类型。catalog是ELEMENT_NODE类型

现在有以下几种:

'ATTRIBUTE_NODE'
'CDATA_SECTION_NODE'
'COMMENT_NODE'
'DOCUMENT_FRAGMENT_NODE'
'DOCUMENT_NODE'
'DOCUMENT_TYPE_NODE'
'ELEMENT_NODE'
'ENTITY_NODE'
'ENTITY_REFERENCE_NODE'
'NOTATION_NODE'
'PROCESSING_INSTRUCTION_NODE'
'TEXT_NODE'
nodeName: catalog
nodeValue: None
nodeType: 1
ELEMENT_NODE: 1
  1. 获得子标签
#coding: utf-8
import xml.dom.minidom
dom = xml.dom.minidom.parse("del.xml")  

root = dom.documentElement
bb = root.getElementsByTagName('maxid')
print type(bb)
print bb
b = bb[0]
print b.nodeName
print b.nodeValue

运行结果

<class 'xml.dom.minicompat.NodeList'>
[<DOM Element: maxid at 0x2707a48>]
maxid
None
  1. 获得标签属性值
#coding: utf-8
import xml.dom.minidom
dom = xml.dom.minidom.parse("del.xml")  

root = dom.documentElement
itemlist = root.getElementsByTagName('login')
item = itemlist[0]
print item.getAttribute("username")
print item.getAttribute("passwd")

itemlist = root.getElementsByTagName("item")
item = itemlist[0]                   #通过在itemlist中的位置区分
print item.getAttribute("id") 

item2 = itemlist[1]                  #通过在itemlist中的位置区分
print item2.getAttribute("id")
pytest
123456
4
2
  1. 获得标签对之间的数据
#coding: utf-8
import xml.dom.minidom
dom = xml.dom.minidom.parse("del.xml")  

root = dom.documentElement
itemlist = root.getElementsByTagName('caption')

item = itemlist[0]
print item.firstChild.data

item2 = itemlist[1]
print item2.firstChild.data
Python
test
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值