Python xml解析记录

最新推荐文章于 2024-06-09 08:19:08 发布

胡老哈

最新推荐文章于 2024-06-09 08:19:08 发布

阅读量3.7k

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/a102111/article/details/50806550

版权

Python 专栏收录该内容

7 篇文章 1 订阅

订阅专栏

Python的xml解析方式自带的有3种，xml.dom.*、xml.sax.*以及xml.etree.ElementTree，相对来说，xml.etree.ElementTree最快捷方便。

因为自己只使用了xml.etree.ElementTree，所以下面就简单记录下xml.etree.ElementTree相关的东西。

基本读写

参考：http://blog.csdn.net/wklken/article/details/7603071

xmlTree = ElementTree.parse('a.xml')  #读入
	xmlNodeList = xmlTree.getiterator('Item')  #获取指定节点
	for node in xmlNodeList:
		print 'node.tag:%s' % node.tag  #节点名
		print 'node.text:%s' % node.text  #节点文字
		if node.attrib.has_key('attr_name'):  #节点attribute
			print 'node.attrib[%s]:%s' % ('attr_name',node.attrib['attr_name']))
			keyPath = node.attrib['attr_name']

xml内含有namespace的坑

如果xml文件有namespace的，ElementTree会修改namespace的名字，一般会改成ns0之类的，如果不希望被更改的话，这样玩：

XML_NS_NAME = 'my_ns'
XML_NS_VALUE = 'http://xxx'
ElementTree.register_namespace(XML_NS_NAME, XML_NS_VALUE)  #在parse之前调用

有namespace的时候，查找需要转换namespace，比如有个节点的attr是：my_ns:name，那么在ElementTree内部会解析成{http://xxx}name，所以查找的时候也需要用{http://xxx}name才能找到。

附一个转换函数：

#xml有namespace的转换成正常可解析的值  有则转换，没有则返回原值
def ParseNameSpace(src, nsName, nsValue):
	if src.find(nsName) != -1:
		dst = src.replace('%s:' % nsName, '{%s}' % nsValue)
		print 'ns src:%s dst:%s' % (src, dst)
		return dst

	return src

胡老哈

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Python xml解析记录

Python的xml解析方式自带的有3种，xml.dom.*、xml.sax.*以及xml.etree.ElementTree，相对来说，xml.etree.ElementTree最快捷方便。因为自己只使用了xml.etree.ElementTree，所以下面就简单记录下xml.etree.ElementTree相关的东西。基本读写参考：http://blog.csdn.net
复制链接

扫一扫