python遍历带命名空间的xml_如何使用python使用默认命名空间获取xml文件中所有元素的xpath？...

最新推荐文章于 2024-06-25 21:17:38 发布

weixin_39517357

最新推荐文章于 2024-06-25 21:17:38 发布

阅读量178

点赞数

文章标签： python遍历带命名空间的xml

我想在xml文件中获取每个元素的xpath.

xml文件：

xmlns="http://www.w3.org/TR/html4/"

xmlns:h="http://www.w3schools.com/furniture">

Apples

Bananas

python代码：

由于不允许使用默认命名空间中的空前缀,因此我使用了自己的前缀.

from lxml import etree

root=etree.parse(open("MyData.xml",'r'))

ns={'df': 'http://www.w3.org/TR/html4/', 'types': 'http://www.w3schools.com/furniture'}

for e in root.iter():

b=root.getpath(e)

print b

r=root.xpath(b,namespaces=ns)

#i need both b and r here

xpath是这样的(输出b)

/*

/*/*[1]

/*/*[1]/*[1]

/*/*[1]/*[1]/h:td

我无法正确获取具有默认命名空间的元素的xpath,它对于那些元素名称显示为*.如何正确获取xpath？

最佳答案您可以使用getelementpath,它始终返回Clark表示法中的元素,并手动替换名称空间：

x = """

xmlns="http://www.w3.org/TR/html4/"

xmlns:h="http://www.w3schools.com/furniture">

Apples

Bananas

"""

from lxml import etree

root = etree.fromstring(x).getroottree()

ns = {'df': 'http://www.w3.org/TR/html4/', 'types': 'http://www.w3schools.com/furniture'}

for e in root.iter():

path = root.getelementpath(e)

root_path = '/' + root.getroot().tag

if path == '.':

path = root_path

else:

path = root_path + '/' + path

for ns_key in ns:

path = path.replace('{' + ns[ns_key] + '}', ns_key + ':')

print(path)

r = root.xpath(path, namespaces=ns)

print(r)

显然,这个例子表明getelementpath返回相对于根节点的路径,比如.和dt：table而不是/ df：root和/ df：root / df：table,所以我们使用root元素的标记来手动构建完整路径.

输出：

/df:root

[]

/df:root/df:table

[]

/df:root/df:table/df:tr

[]

/df:root/df:table/df:tr/types:td[1]

[]

/df:root/df:table/df:tr/types:td[2]

[]

weixin_39517357

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python遍历带命名空间的xml_如何使用python使用默认命名空间获取xml文件中所有元素的xpath？...

我想在xml文件中获取每个元素的xpath.xml文件：xmlns="http://www.w3.org/TR/html4/"xmlns:h="http://www.w3schools.com/furniture">ApplesBananaspython代码：由于不允许使用默认命名空间中的空前缀,因此我使用了自己的前缀.from lxml import etreeroot=etree.par...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。