items里面图片的链接一定要保存在images_urls,他会自动把图片下载到制定文件夹
import scrapy
class RosiItem(scrapy.Item):
image_urls = scrapy.Field()
spider里面将链接赋值给 item[‘image_urls’]
item = RosiItem()
pic_urls = response.xpath('//div[@class="contenta"]/img/@src').extract()
item['image_urls'] = pic_urls
settings
#保存地址,可以自己定义
IMAGES_STORE = 'E:\PICTRRE'
#打开ImagesPipeline
ITEM_PIPELINES = {
'scrapy.pipelines.images.ImagesPipelines':1
}
启动爬虫,图片会保存在,E:\PICTRRE下的一个full文件夹内