第一个坑
我们在使用scrapy的时候都要先创建项目是吧这个就不多说的。
基本的目录结构就是这样,懂的都懂,也不多做解释了:
我就是在这里遇到的坑。
这里面有个pipelines的py文件:
这个img_name变量是为了存储我即将下载的图片的文件名,原理是把图片地址的URL切开,把URL结尾的几个字符作为图片的名称,URL是这样的:
https://car3.autoimg.cn/cardfs/product/g25/M0A/5E/53/autohomecar__ChsEmF9zQUuAOt79ACT7Rgx018s791.jpg
看着没什么问题是吧,我就是把整个URL用"__"分成了两截,确实没问题,但我一开始使用了一个错误的URL,下面会讲到,那个错误的URL是
https://car.autohome.com.cn/photo/series/45606/12/6381824.html
大家看,这里哪有"__"啊,于是悲剧了,代码就是运行不起来,急死我了,