python 抓取中etree和xpath的连用

该代码段展示了如何利用Python的lxml库中的etree模块将HTML字符串解析,并通过xpath选择器提取a标签下的a-param属性值。具体步骤包括将字符串转换为HTML格式,然后定位并打印出a-param属性的内容。
摘要由CSDN通过智能技术生成

from lxml import etree

a = "<a href='javascript:void(0);' a-back=1 a-param='/ShowReport/data?SHOWTYPE=JSON&CATALOGID=1932_dzjyhz&TABKEY=tab1,tab2&DQRQ=2023-07-11&ZQDM=000025&JYLX=000'>查看详情</a>"
res = etree.HTML(a)  #将字符串转为html格式

result= res.xpath('//a/@a-param')[0] #xpath选择器,直接定位a节点使用两个/,使用@a-param定位a标签下a-param属性的值
print(result)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值