爬取图片下载到本地的时候,总有一些图片显示不完全,例如这样:
错误图片展示
出现这种问题的原因是什么呢?
1、网络问题:网络不稳定,接收到的图片信息不完整。也就是说response有问题;
2、本地磁盘满了:有时候接收到的图片信息完整,但是本地磁盘存不下了,毕竟一个图片也要好几Mb呢。
如何检测错误图片呢?
试了很多方法,一个较好的方法就是判断jpg、jpeg、png文件结尾的标识。
JPG文件结尾标识:\xff\xd9
JPEG文件结尾标识:\xff\xd9
PNG文件结尾标识:\xaeB`\x82
检测不完整图片代码
"""
检测图片完整性
"""