Scrapy-selenium

最新推荐文章于 2024-07-26 12:00:00 发布

匪余

最新推荐文章于 2024-07-26 12:00:00 发布

阅读量307

点赞数 5

文章标签： scrapy selenium 测试工具

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44528842/article/details/139307496

版权

逻辑：把渲染之后的对象放到spider项目文件对应的 def parse(self,response)的response中

以前（不需要渲染的网页）是Downloader创建的response→Scrapy Engine→Spiders

现在（需要渲染网页）Downloader不能用了，所以Middlewares创建response（

from scrapy.http import HtmlResponse  用HtmlResponse创建一个response）

→Scrapy Engine→Spiders

如何判定当前页面是否需要使用Selenium

当scrapy通过xpath无法取到内容的时候，动态网页要考虑存在渲染的情况。

假设页面上有“青岛”二字，右键“检查” 在elements中“ctrl+f”搜索看到有“青岛”二字。

右键“检查”→Network→点开“骨骼文件" （第一个）→Response→“ctrl+f”搜索没看到有“青岛”二字

右键“检查”→Network→“ctrl+f”搜索没看到有“青岛”二字

使用方法：在middlewares.py中把原有代码 “ctrl+？”注掉，重新写

关注

5
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Scrapy-selenium

以前（不需要渲染的网页）是Downloader创建的response→Scrapy Engine→Spiders。右键“检查”→Network→点开“骨骼文件" （第一个）→Response→“ctrl+f”搜索没看到有“青岛”二字。假设页面上有“青岛”二字，右键“检查” 在elements中“ctrl+f”搜索看到有“青岛”二字。现在（需要渲染网页）Downloader不能用了，所以Middlewares创建response（右键“检查”→Network→“ctrl+f”搜索没看到有“青岛”二字。
复制链接

扫一扫

匪余 CSDN认证博客专家 CSDN认证企业博客

码龄6年

9: 原创

151万+: 周排名

12万+: 总排名

2213: 访问

: 等级

134: 积分

26: 粉丝

32: 获赞

3: 评论

30: 收藏

私信

关注

热门文章

最新评论

Scrapy中间件的使用
CSDN-Ada助手: 恭喜您写下了关于Scrapy中间件的优质博文！不仅对Scrapy中间件的使用进行了深入探讨，而且表达清晰，条理分明。希望您能继续坚持创作，探索更多有关Scrapy的知识点，比如Scrapy的调度器、管道等功能，这样可以帮助更多的读者更好地理解和应用Scrapy框架。期待您的下一篇博文！
Scrapy 随机请求头
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
关键词云代码报错及原因记录
CSDN-Ada助手: 很棒的博文！解决问题的过程记录得很详细，对读者帮助很大。希望你能继续分享类似的经验，让更多人受益。另外，在处理代码报错时，除了修改文件路径，也可以尝试使用异常处理语句来捕获错误，这样可以增加代码的鲁棒性。另外，对于Python代码的调试和优化也是一个很重要的技能，建议你学习一些相关的调试工具和代码优化方法，这样可以提高自己的编程水平。期待你的更多精彩内容！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。