需求分析
需求:爬取斗鱼主播图片,并下载到本地
思路:
- 使用Fiddler抓包工具,抓取斗鱼手机APP中的接口
- 使用Scrapy框架的ImagesPipeline实现图片下载
ImagesPipeline实现图片下载的使用方法:
- 在items中的XxxItem中定义 image_urls 和 images字段
- 在spider中将提取出来的图片链接保存到Item的 image_urls 字段中(注意:该字段接收一个可迭代对象,否则报错)
- 在settings文件中进行配置,具体配置见 settings.py 文件
报错 : ValueError: Missing scheme in request url: h
Traceback (most recent call last):
File "/usr/local/lib/python3.5/dist-packages/twisted/internet/defer.py", line 653, in _runCallbacks
current.result = callback(current.result, *args, **kw)
File "/usr/local/lib/python3.5/dist-packages/scrapy/pipelines/media.py", line 79, in process_item
requests = arg_to_iter(self.get_media_requests(item, info))
File "/usr/local/lib/python3.5/dist-packages/scrapy/pipelines/images.py", line 155, in get_medi
使用Scrapy的ImagesPipeline下载斗鱼主播图片

本文介绍了如何利用Scrapy框架中的ImagesPipeline组件来爬取并下载斗鱼主播图片。通过Fiddler抓包获取接口,定义items和settings,处理报错问题,最终实现图片的本地存储。
最低0.47元/天 解锁文章
64万+

被折叠的 条评论
为什么被折叠?



