scrapy爬虫【3】→爬图片

爬图片在scrapy中特别简单,其实原理也是非常简单啊
打开图片的url,然后保存到本地。
不用scrapy:

r = requests.get(url)
Image.open(BytesIO(r.content)).save('images\1.jpg')

现在看一下用scrapy该怎么弄
接着上篇博客的代码,为了方面大家看出增加的代码,我以图片的形式展示
先看一下item.py中增加的代码吧

IMG_URL = scrapy.Field()

没错only one line

spider里面的代码,也可以说只增加了一行代码
这里写图片描述

还需要在settings.py中加入一些代码

# 下载图片的pipelines scrapy都做好了
ITEM_PIPELINES = {'scrapy.pipelines.images.ImagesPipeline': 1}
# items 中图片的url
IMAGES_URLS_FIELD = 'IMG_URL'
# .代表当前路径
IMAGES_STORE = '.'

注意:如果提示你有某些函数有问题,PIL库没有装,你百度一下很快能装好

看一下我爬出来的结果:
这里写图片描述

再次说一下scrapy保存图片的几个坑?
1. 必须保存为数组的形式
2. 必须加上http:

如果上面两个坑你都注意到了,还是没爬到图片
或者你想自己去爬百度的美眉(百度美眉不是那么容易搞定的)
O(∩_∩)O哈哈~请参考我的第一篇博客:
http://blog.csdn.net/program_anywhere/article/details/72850085

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值