爬虫scrapy:下载图片项目

使用scrapy的ImagesPipeline这个类来做图片下载
使用步骤:
1、在settings.py中配置item_pipelines
打开:
ITEM_PIPELINES = {
‘scrapy.pipelines.images.ImagesPipeline’: 300,
}
添加:
文件保存在哪里:
IMAGES_STORE = ‘images’
#指定这个配置后,会出现3张图,一张原图,两张指定大小图
IMAGES_THUMBS = {
‘big’ :(270,270),
‘small’ :(100,100)
}
在scrapy的spider中,任何一个parse方法返回(yield/return)的内容有两个,一个是item,一个是request对象
前者会被pipelines接收,后者会被scrapy引擎发送给调度加入调度队列。
1、创建项目和spider文件
2、配置setting: ‘scrapy.pipelines.images.ImagesPipeline’
在这里插入图片描述
按住shift两次就可以搜索进入这个类
在这里插入图片描述

3、分析url:
1、ajax请求的url拿出来对比看看哪里变化,看=后面的变不变,前面的是键不管。
2、拿出一下对比有哪些值是变化的
在这里插入图片描述
在这里插入图片描述
4、添加cookie
在这里插入图片描述
5、将获取到的数据返回给ImagesPipeline这个类
在这里插入图片描述

这种情况是本次url携带下个url的信息,赋值重新下载response调用自己
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值