爬取网页图片显示似乎不支持此文件格式
在学习Python爬虫时,模仿demo自己写一遍的时候,发现保存到文件的图片点开后显示似乎不支持此文件格式,一开始以为是正则没写对,然后查看图片的大小后发现只有80多k,检查后发现问题如下:
出现的错误:
原因是因为在保存到对应文件路径时的response.content,是读取的第一次response响应的结果,在改变获取图片的后缀为txt后发现,是全网页的源代码
所以问题出在保存的数据源不对,图片的url保存在urls中,在for循环里用了url去遍历每一个图片的url,解决方法就是在获取到每一张图片的url后,重新用requests去得到一次源码,然后再用response.content获取图片的数据保存到文件。(由于是图片文件,写入时候要 wb 方式,response得到数据时,也要用content读取二进制)