下载图片的地址封装成请求对象,然后交给下载队列处理,
第一个方法触发:
1.spider模块,通过yield发送items对象的时候,
2.把items对象交给pipeline模块做处理的时候,会触发第一个方法
3.方法里面把图片的urls封装成请求对象,然后通过yield交给引擎,
4.由引擎放入待请求的队列中,然后由下载器下载,
5.下载后,图片保存到指定位置,位置在settings中设置,
第二个方法:不必须
1.下载成功后触发,success=True,下载成功,image_info_or_failure字典
可以给图片改名,
触发时机:下载成功后触发,
字典的三个:url:原始url,path:本地存储位置,checksum:校验码
2.success=false,下载失败,image_info_or_failure出错信息
想生成图片缩略图,在settings添加设置
谷歌浏览器可以格式化json代码
爬虫--scrapy下载图片和生成缩略图
最新推荐文章于 2021-02-05 22:28:30 发布
本文介绍了使用Scrapy框架下载图片的过程,包括如何将图片URL封装为请求对象,通过下载器进行下载,并在下载成功后进行图片命名和保存。同时,文章提到了在下载成功后,可以通过设置生成图片的缩略图。Scrapy的items.py、run.py、settings.py、douyu.py和pipelines.py等文件在这一过程中起到了关键作用。
摘要由CSDN通过智能技术生成