在调用opencv的imread函数读取图像时,我们得到的其实是一个类型为numpy.ndarray的n维数组。这个数组的维度是[height,width,3],它是由每个像素的RGB通道的灰度值组成。
(img[:,:,0],img[:,:,1],img[:,:,2] 分别对应B、G、R通道。)
因此一切对于图像的操作,其实都是对于该数组的操作,在实际应用中,运用numpy和opencv模块的数组或矩阵的操作,可以大大节省处理图像的时间。
举个简单的例子,我们想得到图像某一区域内所有R通道值大于50的像素坐标,最简单的方法是用for循环:
for i in range(width):
for j in range(height):
if img[i,j,2]>50:
print(i,j)
很显然,这段算法的时间复杂度是O(n²),处理大图片非常之慢。那么有没有更好的办法呢?当然有,容我先卖个关子,让我们先来学习一些简单的数组/矩阵操作。
1.赋值
当我们需要改变图像的RGB值时,并不需要用for循环挨个赋值,而是可以直接对img数组的值进行修改。比如要将图像的灰度值取反,我们可以:
img[:,:]=255-img[:,:]
这个语句等同于opencv库的函数cv2.bitwise_not(),这样整幅图像的灰度值就都取反了。有兴趣的话,可以比较一下这两种方式的运行时间。
也可以通过设置范围,只操作图像的某一部分,比如我们要取图像的0-100行,100-200列:
img[0:100,100:200] #