python-XPath查找文本和树迭代

本文介绍了如何使用Python的lxml库中的XPath表达式来查找XML文档中的文本,并展示了如何进行树迭代,遍历XML树结构。通过示例,解释了XPath的`string()`和`text()`函数,以及如何过滤元素进行迭代。
摘要由CSDN通过智能技术生成

这是一个关于使用lxml.etree进行XML处理的教程。它简要概述了ElementTree API的主要概念,以及一些简单的增强功能,使您作为程序员的生活更轻松。

有关API的完整参考,请参阅生成的API文档。

内容

本文章主要介绍的是使用XPath查找文本和树迭代

使用XPath查找文本

提取树的文本内容的另一种方法是XPath,它还允许您将单独的文本块提取到列表中:

打印(HTML 。XPath的(“字符串()” )) 仅#lxml.etree!
TEXTTAIL

打印(HTML 。XPath的(“//文本()” )) 仅#lxml.etree!
[‘TEXT’,‘TAIL’]
如果你想更频繁地使用它,你可以将它包装在一个函数中:

build_text_list = etree 。XPath (“// text()” ) #lxml.etree!
print (build_text_list (html ))
[‘TEXT’,‘TAIL’]
请注意

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值