python处理xml文件_Python处理XML之DOM解析

print "===========DOM方式解析XML文档======================="

'''

DOM 将XML文档定义为如下格式:

根节点

||

元素节点====属性节点

||

元素节点 OR 文本节点 OR CDATA节点

'''

from xml.dom.minidom import *

#传递文件路径或者是文件对象,如果是文件对象,调用parse之后,已经将DOM树加载到了内存

#,可以调用完之后立即关闭

domfile=parse("xmldata.xml")

#DOM以树的方式对xml解析,要求XML文档只能有一个根节点,

root=domfile.documentElement

#xml的DOM树已经加载到内存,因此文件可以关闭了

#可以用getElementsByTag来根据标签名来获取节点

children=root.childNodes

users=[]

user={}

for child in children:

#跳过空格、回车等Text_Node=3子元素、ELEMENT_NODE=1、ATTRIBUTE_NODE=2

if child.nodeType==root.ELEMENT_NODE:

#通过attributes属性获取父节点的所有属性节点,通过方法getAttribute获取指定属性的值

user.update({"name":child.getAttribute("name")})

grands=child.childNodes

for grand in grands:

#元素节点本身不包含值,只能通过获取被它包含的文本节点、属性节点来读取值

if grand.nodeType==root.ELEMENT_NODE:

texts=grand.childNodes

#Python 2.6以后,文本节点的值通过nodeValue属性获取,而不是text属性

user.update({"description":texts[0].nodeValue.strip()})

users.append(user)

#处理完一个user之后,注意重置中间变量

user={}

#DOM将空格、回车等XML格式化的内容认为是文本节点,必须跳过处理

print users

for user in users:

for item in user.items():

key,value=item

print key,value.encode("GBK")

处理的数据时一样的

分享到:

sina.jpg

tec.jpg

2012-10-19 11:01

浏览 4736

评论

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值