xpath 取标签下所有文字内容_xpath提取目录下所有标签内的内容，递归 //text（）...

最新推荐文章于 2023-05-05 14:25:21 发布

weixin_39610422

最新推荐文章于 2023-05-05 14:25:21 发布

阅读量1k

点赞数 1

文章标签： xpath 取标签下所有文字内容

本文链接：https://blog.csdn.net/weixin_39610422/article/details/111907292

版权

该博客介绍了如何使用XPath从HTML中提取所有标签内的文字内容，包括Python示例代码，展示了遍历并提取指定ID下不同标签内容的方法。

摘要由CSDN通过智能技术生成

利用xpath来提取所有标签里面的内容，即使标签头不同

#-*-coding:utf8-*-

import re

import os

from lxml import etree

html = '''

测试-常规用法

是

谁

'''

selector = etree.HTML(html)

for k in range(1,3):

chinese = selector.xpath('//div[@id="content"][%s]/ul[@id="useful"]//text()'%k)

data = "".join([each for each in chinese])

english = selector.xpath('//div[@id="content"][%s]/ul[@id="useless"]//text()'%k)

Data = "".join([each for each in english])

print data

prin

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注