参考博客
上图是爬出来的效果
修改settings文件
增加下载图片的管道
以及图片的存储路径
修改爬虫代码
增加img 字段
items文件内也要增加
修改管道
新增一个管道类
下载图片需要继承ImagesPipeline
重写其方法
get_media_requests 获取图片链接 请求下载
file_path 重命名下载后的文件
item_completed 下载完成之后的处理
这里有几个坑点
-
管道的方法内,有的方法需要加上return items 不然后续可能拿不到item
-
就是获得item类对象的时候,要注意位置,我一开始是放在for外面的,导致我得到的结果全部都是一个名字,调了蛮久。。。