from lxml import etree
a = "<a href='javascript:void(0);' a-back=1 a-param='/ShowReport/data?SHOWTYPE=JSON&CATALOGID=1932_dzjyhz&TABKEY=tab1,tab2&DQRQ=2023-07-11&ZQDM=000025&JYLX=000'>查看详情</a>"
res = etree.HTML(a) #将字符串转为html格式result= res.xpath('//a/@a-param')[0] #xpath选择器,直接定位a节点使用两个/,使用@a-param定位a标签下a-param属性的值
print(result)
python 抓取中etree和xpath的连用
最新推荐文章于 2023-12-02 16:35:00 发布
该代码段展示了如何利用Python的lxml库中的etree模块将HTML字符串解析,并通过xpath选择器提取a标签下的a-param属性值。具体步骤包括将字符串转换为HTML格式,然后定位并打印出a-param属性的内容。
摘要由CSDN通过智能技术生成