scrapy练习02---同时爬取数据信息和图片

最新推荐文章于 2023-11-22 11:16:16 发布

我永远喜欢希露菲叶特

最新推荐文章于 2023-11-22 11:16:16 发布

阅读量404

点赞数 1

分类专栏：学习记录文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42405558/article/details/113818719

版权

学习记录专栏收录该内容

16 篇文章 0 订阅

订阅专栏

参考博客

博客1
博客2

在这里插入图片描述
上图是爬出来的效果

修改settings文件

在这里插入图片描述
增加下载图片的管道
以及图片的存储路径

修改爬虫代码

在这里插入图片描述
增加img 字段

items文件内也要增加

修改管道

在这里插入图片描述
新增一个管道类
下载图片需要继承ImagesPipeline
重写其方法
get_media_requests 获取图片链接请求下载
file_path 重命名下载后的文件
item_completed 下载完成之后的处理

这里有几个坑点

管道的方法内，有的方法需要加上return items 不然后续可能拿不到item
就是获得item类对象的时候，要注意位置，我一开始是放在for外面的，导致我得到的结果全部都是一个名字，调了蛮久。。。

我永远喜欢希露菲叶特

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
scrapy练习02---同时爬取数据信息和图片

参考博客博客1博客2上图是爬出来的效果修改settings文件增加下载图片的管道以及图片的存储路径修改爬虫代码增加img 字段items文件内也要增加修改管道新增一个管道类下载图片需要继承ImagesPipeline重写其方法get_media_requests 获取图片链接请求下载file_path 重命名下载后的文件item_completed 下载完成之后的处理这里有几个坑点管道的方法内，有的方法需要加上return items 不然后续可能拿
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。