＜爬虫＞ requests和selenium的区别 / 为什么有的网站数据requests爬不下来

最新推荐文章于 2024-07-06 20:31:32 发布

当代女大学生

最新推荐文章于 2024-07-06 20:31:32 发布

阅读量3.2k

点赞数 1

分类专栏： Python 文章标签：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36895331/article/details/121514063

版权

Python 专栏收录该内容

56 篇文章 3 订阅

订阅专栏

有的网页中的信息需要执行js才能显现

通过requests只能爬取原网页代码
通过selenium才可以爬取执行 js 后的网页数据，实现“所见即所得”

注意：要等网页加载完selenium才能爬取成功否则也无法爬出数据

Selenium 的缺点：

速度慢。每次运行爬虫都打开一个浏览器，如果没有设置，还会加载图片、JS等等一大堆东西。
占用资源太多。
对网络的要求会更高。 Selenium 加载了很多可能对您没有价值的补充文件（如css，js和图像文件）。与仅仅请求您真正需要的资源（使用单独的HTTP请求）相比，这可能会产生更多的流量。
爬取规模不能太大。

当代女大学生

关注

1
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。