图像处理的最基本工作,也是第一步工作:读取、显示和输出图片。
1.图像读取
opencv图像读取的函数是:imread(图像路径,加载模式);输入参数有2个:
- “图像路径”是一个字符串;使用绝对路径和相对路径都是可以的,但相对路径必须是程序的工作路径。一般的图像格式都是支持的,如bmp,jpg,png,tiff等。
- “读取模式”是一个枚举型的整数,用于指定读取图像的颜色类型。缺省值是1,一般在调用时我们可以不输入这个参数,默认值1表示载入三通道的彩色图像。有如下取值:
- IMREAD_UNCHANGED:取值:-1。不改变原始图像的读取模式。
- IMREAD_GRAYSCALE:取值:0。将图像转换成灰度图读取。
- IMREAD_COLOR:取值:1。为默认缺省值,将图像转换成3通道彩色图像读取。
- IMREAD_ANYDEPTH:取值:2。读取后是灰度图。这个没搞明白是什么意思。知道的朋友不妨留言指教,不甚感激。
- IMREAD_ANYCOLOR:取值:4。无损读取原始图像。源图像为彩色图像就读取为3通道彩色图像,源图像为灰度图就读取为灰度图。
为更一步准确掌握这些参数的区别,用3幅图像测试下,这三幅图像分别为:”scooter.png” :带alpha通道的彩色图像; “lenna.bmp”:3通道彩色图像; “moon.bmp”:灰度图像。如下图所示:
import cv2
scooter_path = "scooter.png" # 带alpha通道的彩色图像
lenna_path = "lenna.bmp" # 3通道彩色图像
moon_path = "moon.bmp" # 灰度图像
pic = [scooter_path, lenna_path, moon_path]
for p in pic:
for i in [-1, 0, 1, 2, 4]: # 加载模式的取值
img = cv2.imread(p, i)
print(p, i, img.shape)
输出结果:
scooter.png -1 (512, 512, 4)
scooter.png 0 (512, 512)
scooter.png 1 (512, 512, 3)
scooter.png 2 (512, 512)
scooter.png 4 (512, 512, 3)
lenna.bmp -1 (512, 512, 3)
lenna.bmp 0 (512, 512)
lenna.bmp 1 (512, 512, 3)
lenna.bmp 2 (512, 512)
lenna.bmp 4 (512, 512, 3)
moon.bmp -1 (640, 662)
moon.bmp 0 (640, 662)
moon.bmp 1 (640, 662, 3)
moon.bmp 2 (640, 662)
moon.bmp 4 (640, 662)
我们可以从读入图像后的shape中看出一些端倪。
- 当取值为-1时,即读取模式为IMREAD_UNCHANGED时,源图像是什么样就是什么样。
- 当取值为0时,即读取模式为IMREAD_GRAYSCALE时,都读取成灰度图像。
- 当取值为1时,即读取模式为IMREAD_COLOR时,不管源图像是什么,都转换成3通道图像。
- 当取值为2时,即读取模式为IMREAD_ANYDEPTH时,都读取成了灰度图,没搞明白与上面的IMREAD_GRAYSCALE有什么区别。
- 当取值为4时,即读取模式为IMREAD_ANYCOLOR时,源图像为彩色图像就读取为3通道彩色图像,源图像为灰度图就读取为灰度图。
一般来说,将图像读取成统一的模式对于后续的处理非常重要,一般都使用3通道的彩色图像进行处理,所以默认值是1,即不管源图像是什么,统一转成3通道的图像。对于灰度图,也是3通道,只不过每个通道的值都相等。
如果需要特殊处理,例如只处理灰度图,或需要alpha通道,那么就可以灵活使用其它的读取模式。
2.图像显示
import cv2
lenna_path = "lenna.bmp"
img = cv2.imread(lenna_path)
cv2.imshow('lenna', img)
cv2.waitKey()
opencv中的图像显示函数是imshow(title,img),title是显示图片的窗口标题,img就是要显示的图像。如果不添最后一句cv2.waitKey(),执行时窗口是一闪而过。waitKey()表示无限等待。中间可以输入数值,如5000,cv2.waitKey(5000),表示5000毫秒即5秒后自动关闭窗口。
lenna_path = "lnnea.bmp"
img = cv2.imread(lenna_path)
cv2.imshow('lenna', img)
cv2.waitKey()
输出:
error: (-215) size.width>0 && size.height>0 in function cv::imshow
从报错信息可以推断,是图像的size有问题,即没有得到图像的size。换句话说就是没有读取到源图像。仔细检查发现是文件名弄错了。
这里需要注意,调用imread(),就算图像的路径是错的,或者没有这张图片, 也不会报错,但得到的是None。接着往下使用imshow()显示的话就会报错。
所以下次看到这个size的报错信息,一定是图片路径或图片名称错了。
opencv对多个图片输出在同一个窗口并没有直接的支持手段,但有时候我们会有这个需求,这时使用matplotlib搭配使用比较合适,这个以后再说。
3.图像输出
lenna_path = "Input\\lenna.bmp"
img = cv2.imread(lenna_path)
cv2.imwrite('Output\\lenna.jpg', img)
opencv中的图像输出函数是imwrite(path, img);path是输出图片的路径和名称,格式转换在这里只需要换个后缀名即可。img就是要保存的图像。
需要注意的是,如果输出时,指定的输出目录不存在,例如不存在Output目录,imwrite()不会报错,但也不会自动创建目录然后输出。这样做的结果是什么也没有发生。