scrapy的xpath无法匹配tbody标签

最新推荐文章于 2024-06-28 15:36:23 发布

不论如何未来很美好

最新推荐文章于 2024-06-28 15:36:23 发布

阅读量5.1k

点赞数 8

分类专栏： python3 爬虫实战数据挖掘文章标签： scrapy xpath tbody

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36523839/article/details/79992002

版权

数据挖掘同时被 2 个专栏收录

51 篇文章 27 订阅

订阅专栏

python3 爬虫实战

7 篇文章 2 订阅

订阅专栏

刚才在使用scrapy的xpath时遇到了一点问题，个人觉得很有意思，也是在无意中发现的，认为是个坑，也是个很有意思的问题，所以这里做个介绍和笔记。

问题：使用scapy的xpath在匹配<tbody>位置时无法获取。（使用浏览器自带copy的xpach）

我使用的charm浏览器，在检查元素时，直接copy了它的xpath表达式。但是当运行时，却始终没有获取到目的信息。

使用它的表达式，你会发现，并没有东西，所以我开始检查问题，将标签一个一个减少，直到

减少到<table>时才有返回，这说明<table>的下一个标签匹配也就是<tbody>出现了问题，我也修改了一些获取方式，还是不行。

很头疼，在反复的实验下，我查看了此处的网页结构，试着匹配跳过它的，没想到竟然有发现了。

当去掉<tbody>标签时，居然就可以向下匹配了。很有意思，于是我google了一下原因，总结的也不是很详细，大概就是当charm浏览器在解析网页时添加了一个<tbody>标签，不知道它是在<table>标签中没有<tbody>就会加，还是有根据的加。

现在只要留意<tbody>标签的匹配就行了，当遇到相同的问题时，可以参考这个问题，有可能原因都一样。

不论如何未来很美好

关注

8
点赞
踩
5

收藏

觉得还不错? 一键收藏
6
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。