scrapy实践三（爬取豆瓣某话题下图片）

最新推荐文章于 2024-11-08 15:57:22 发布

丹尼尔•卡尼�

最新推荐文章于 2024-11-08 15:57:22 发布

阅读量329

点赞数

分类专栏： scrapy 文章标签： selenium

本文链接：https://blog.csdn.net/qq_51598376/article/details/113917714

版权

本文介绍了如何使用Scrapy爬取豆瓣特定话题下的所有图片。首先通过selenium进行登录并定位图片元素，然后尝试用Scrapy实现爬虫，虽然遇到了无法精确目标的挑战，但设置header后解决了cookie访问问题。

摘要由CSDN通过智能技术生成

前言

全局思路

目标

爬取豆瓣话题【你看过哪些非常有哲理的漫画】下的所有图片

过程梳理

先用普通selenium试一试，然后再使用scrapy爬取

观察网页

在这里插入图片描述
向下滑动会一直出现图片

普通selenium方法

思路：
用保存了cookie的selenium登录该页面
定位图片的
一次保存
操作
代码如下

#Cookie: ll="108297"; bid=Js9xsAq24wE; __yadk_uid=Dl3d4S34ZIAcgpdKiBb7MzSGIeRgFKar; _vwo_uuid_v2=DC3BB855EB5062400749F27AB6BE5CC06|840943523ee629a704e0ce81eb53bca0; __utmz=30149280.1613021276.4.4.utmcsr=baidu|utmccn=(organic)|utmcmd=organic; push_doumail_num=0; __utmv=30149280.20597; douban-profile-remind=1; push_noty_num=0; dbcl2="205973871:7MTt7TSBboU"; ck=oCQO; __utmc&