Xpath进阶操作【内含多个实战讲解】

孤寒者

已于 2023-03-24 21:14:17 修改

阅读量2.6w

点赞数 66

分类专栏：爬虫从入门到精通系列教程文章标签： python 爬虫 xpath 项目实战 xpath进阶

于 2023-03-24 09:00:00 首次发布

转载需文末联系本作者（未经本人允许的转载完全不允许！）

本文链接：https://blog.csdn.net/qq_44907926/article/details/129725749

版权

爬虫从入门到精通系列教程专栏收录该内容

27 篇文章 227 订阅 ¥29.90 ¥99.00

订阅专栏

想必大家通过我的这篇xpath详解，已经能非常熟练的使用xpath进行页面信息的提取。
但是可能会在某些提取要求比较苛刻的时候不知道怎么写xpath，而退而求其次，在python里对提取的不是最终想要的结果进行二次处理。
所以本文就来讲讲xpath进阶操作，结合多个实战，加油！

https://gu-han-zhe.blog.csdn.net/article/details/120247868
《万字博文教你python爬虫XPath库【详解篇】》

目录：

xpath进阶操作：
xpath进阶操作实战：
拓展——骚操作：
- 1.用样式隐藏标签：
- 2.xpath利器：

xpath进阶操作：

匹配某个标签但是不包含某个标签：
实操：匹配所有div下面的所有text，但是不包括style标签和script标签中的text。
//div[@class="box_statem"]//*[not(self::style) and not(self::script)]/text()
匹配最后一个。
book[last()]

匹配倒数第二个book元素：
book[last()-1]

或者查询。
//div[@id="content" or @class="cs-entry__header-info"]//sp

了解本专栏

关注

66
点赞
踩
64

收藏

觉得还不错? 一键收藏
打赏
55
评论
Xpath进阶操作【内含多个实战讲解】

万字博文教你python爬虫XPath库【详解篇】》
复制链接

扫一扫

专栏目录

评论 55

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

孤寒者 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。