自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_44737987的博客

一二一O CSDN认证博客专家 CSDN认证企业博客

码龄5年

6: 原创

47万+: 周排名

61万+: 总排名

4400: 访问

: 等级

66: 积分

1: 粉丝

1: 获赞

6: 评论

16: 收藏

私信

关注

热门文章

分类专栏

python高并发
scrapy 5篇

最新评论

scrapy对接selenium爬取动态渲染页面
The quiet coder: 看错了，全部放在list里面太吃内存了，还有好的解决办法吗？
scrapy对接selenium爬取动态渲染页面
The quiet coder: 你这也只能获取到这个页面的内容，要是它的地址没变，其内容改变了怎么解决呢？
scrapy_selenium 使用 SeleniumRequests
一二一O: 不好意思，没咋关注这个，目前看来是这样，scrapy_selenium 一直都没更新，可能也有其他方案，这个我不清楚了但是这个selenium 始终不是长久之计，爬虫的话，在我看来应该向 js逆向的方向走，而不是自动化的selenium，毕竟selenium 效率肯定不如直接请求。
scrapy_selenium 使用 SeleniumRequests
一二一O: 你可以先别开无头浏览器，有些页面是可以检测到selenium的，因此先要排除这个原因，如果浏览器显示不出来这大概率是被检测了，被检测的话，可以看我写的selenium爬取渲染页面的文章如何防止被检测，但是这样效率是比较低的，爬虫无非是需要获取页面中数据，很多网站都是前后端分离的，可以尝试换种思路直接去从页面获取数据的url中获取，我可以给你个例子，是马蜂窝爬取游记的项目。这个我还没分享出来如果需要我可以先给你代码，里面有大部分代码的注解
scrapy_selenium 使用 SeleniumRequests
lethenight: 请问，为什么我配了之后渲染不了

最新文章

scrapy

关注

文章平均质量分 85

关注数：文章数：5 文章阅读量：4075 文章收藏量：16

作者: 一二一O

这个作者很懒，什么都没留下…

展开