python处理xml文件_Python处理XML之DOM解析

最新推荐文章于 2023-02-02 16:58:11 发布

weixin_39923623

最新推荐文章于 2023-02-02 16:58:11 发布

阅读量167

点赞数

文章标签： python处理xml文件

print "===========DOM方式解析XML文档======================="

'''

DOM 将XML文档定义为如下格式：

根节点

||

元素节点====属性节点

||

元素节点 OR 文本节点 OR CDATA节点

'''

from xml.dom.minidom import *

#传递文件路径或者是文件对象，如果是文件对象，调用parse之后，已经将DOM树加载到了内存

#，可以调用完之后立即关闭

domfile=parse("xmldata.xml")

#DOM以树的方式对xml解析，要求XML文档只能有一个根节点，

root=domfile.documentElement

#xml的DOM树已经加载到内存，因此文件可以关闭了

#可以用getElementsByTag来根据标签名来获取节点

children=root.childNodes

users=[]

user={}

for child in children:

#跳过空格、回车等Text_Node=3子元素、ELEMENT_NODE=1、ATTRIBUTE_NODE=2

if child.nodeType==root.ELEMENT_NODE:

#通过attributes属性获取父节点的所有属性节点，通过方法getAttribute获取指定属性的值

user.update({"name":child.getAttribute("name")})

grands=child.childNodes

for grand in grands:

#元素节点本身不包含值，只能通过获取被它包含的文本节点、属性节点来读取值

if grand.nodeType==root.ELEMENT_NODE:

texts=grand.childNodes

#Python 2.6以后，文本节点的值通过nodeValue属性获取，而不是text属性

user.update({"description":texts[0].nodeValue.strip()})

users.append(user)

#处理完一个user之后，注意重置中间变量

user={}

#DOM将空格、回车等XML格式化的内容认为是文本节点，必须跳过处理

print users

for user in users:

for item in user.items():

key,value=item

print key,value.encode("GBK")

处理的数据时一样的

分享到：

2012-10-19 11:01

浏览 4736

评论

weixin_39923623

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python处理xml文件_Python处理XML之DOM解析

print "===========DOM方式解析XML文档======================="'''DOM 将XML文档定义为如下格式：根节点||元素节点====属性节点||元素节点 OR 文本节点 OR CDATA节点'''from xml.dom.minidom import *#传递文件路径或者是文件对象，如果是文件对象，调用parse之后，已经将DOM树加载到了内存#，可以调...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。