imghdr模块
功能描述:imghdr模块用于识别图片的格式。它通过检测文件的前几个字节,从而判断图片的格式。
唯一一个API
imghdr.what(file, h=None)
第一个参数file可以是用rb模式打开的file对象或者表示路径的字符串和PathLike对象。h参数是一段字节串。函数返回表示图片格式的字符串。
>>> import imghdr
>>> imghdr.what('test.jpg')
'jpeg'
具体的返回值和描述如下:
返回值 | 描述 | 检测方式 |
---|---|---|
jpeg | 用JFIF或者Exif格式保存的JPEG图片 | 第7到第10个字节是b’JFIF’或者b’Exif’ |
png | 可移植网络图形格式(Portable Network Graphic Format) | 以字节串b’\x89PNG\r\n\x1a\n’开头 |
gif | GIF(Graphics Interchange Format)的87版本和89版本 | 前6个字节为b’GIF87a’或者b’GIF89a’ |
tiff | TIFF(Tag Image File Format)的两种字节顺序 | 前两个字节为b’MM’或者b’II’ |
rgb | SGI ImgLib | 以字节串b’\x01\xda’开头 |
pbm | Portable Bitmap | 第1个字节为b’P’,第2个字节为b’1’或b’4’,第3个字节为b’\t’或b’\n’或b’\r’ |
pgm | Portable Graymap Files | 第1个字节为b’P’,第2个字节为b’2’或b’5’,第3个字节为b’\t’或b’\n’或b’\r’ |
ppm | Portable Pixmap Files | 第1个字节为b’P’,第2个字节为b’3’或b’6’,第3个字节为b’\t’或b’\n’或b’\r’ |
rast | Sun Raster | 以字节串b’\x59\xA6\x6A\x95’开头 |
xbm | X Bitmap Files | 以字节串b’#define ‘开头 |
bmp | Bitmap,Windows标准图像文件格式 | 以字节串b’BM’开头 |
webp | 谷歌的WebP格式,Python3.5加入 | 以字节串b’RIFF’开头并且第9到第12个字节为b’WEBP’ |
exr | OpenEXR,Python3.5加入 | 以字节串b’\x76\x2f\x31\x01’开头 |
模块内部缺陷
当h参数不为空时,模块会忽略掉file参数,直接检测h参数,但此时file参数又是必须提供的,算是一个设计缺陷吧。博主个人感觉这个h参数根本没有存在的意义,没必要放在参数列表里面。
>>> import imghdr
>>> imghdr.what('test.jpg', b'\x89PNG\r\n\x1a\n')
'png'
>>>
自定义检测流程
imghdr内部使用了test_jpeg、test_png、test_gif等函数检测文件的格式。模块内部维护了一个函数列表imghdr.tests,每次调用what函数的时候,会按列表里的顺序调用检测函数,当检测函数返回结果时退出循环。用户可以通过修改这个列表达到修改检测流程的目的。同时,也可以自行添加检测函数到列表里面。
下面这个例子,博主添加了一个函数放在检测流程的最后提示文件不是图片:
>>> import imghdr
>>> def final(h, f):
... print("This file isn\'t a image!")
...
>>> imghdr.tests.append(final)
>>> imghdr.what("imghdr.md")
This file isn't a image!
自行添加检测函数需要接收两个参数h和f,h是用来检测的字节串,f是file对象。但是在模块内部自带的检测函数都是没用到这个f参数的…
命令行启动imghdr模块
博主读源码的时候发现了官方文档里面没提到的两个函数,提供了直接用命令行启动imghdr模块的方法。
只需要调用python -m imghdr [-r] file1 file2...
就可以直接检测文件的类型。file可以是文件也可以是文件夹。该命令默认只检测文件夹下一层的文件类型,如果需要递归检测,则加上-r参数。
每个文件以”文件名: 文件类型/None”的形式打印一行输出结果。
总结:可能是因为使用的人少的原因,imghdr这个模块内部有挺多小问题,不过只要老老实实按照官方提供的文档使用是不会出事的。博主后面试着改一下这个模块然后pr上去。