opencv篇
1、opencv读取图像
img = cv2.imread(文件名,[,参数])
参数(1) cv2.IMREAD_UNCHANGED (图像不可变)
参数(2) cv2.IMREAD_GRAYSCALE (灰度图像)
参数(3) cv2.IMREAD_COLOR (读入彩色图像)
参数(4) cv2.COLOR_BGR2RGB (图像通道BGR转成RGB)
2、opencv显示图像
cv2.imshow("窗口名", 图像名)
3、窗口等待
cv2.waitKey(delay)
键盘绑定函数,共一个参数,表示等待毫秒数,将等待特定的几毫秒,看键盘是否有输入,返回值为ASCII值。如果其参数为0,则表示无限期的等待键盘输入;参数>0表示等待delay毫秒;参数<0表示等待键盘单击。
4、删除窗口
cv2.destroyAllWindows()
删除所有窗口
cv2.destroyWindows()
删除指定的窗口
5、写入图片
retval = cv2.imwrite("文件地址", 图像名)
6、读取像素
eg:
test=img[88,42]
print(test)
灰度图像:返回值 = 图像(位置参数)
eg:
blue=img[88,142,0] green=img[88,142,1] red=img[88,142,2]
print(blue)
print(green)
print(red)
彩色图像:返回值 = 图像[位置元素, 0 | 1 | 2 ] 获取BGR三个通道像素
注意OpenCV读取图像通道是BGR,也可以转换成RGB在进行处理
7、修改像素
修改图像如果是灰度图像则直接赋值新像素即可,彩色图像依次给三个值赋值即可。
img[88,142] = 255
灰度图像:
#方法一
img[88,142, 0] = 255
img[88,142, 1] = 255
img[88,142, 2] = 255
#方法2
img[88,142] = [255, 255, 255]
彩色图像
img[100:200, 150:250] = [255,255,255]
局部修改,将行为100到200、列150到250的像素区域设置为白色。
8、拆分通道
OpenCV读取的彩色图像由B、G、R三原色组成,可以通过下面代码获取不同的通道。
b = img[:, :, 0]
g = img[:, :, 1]
r = img[:, :, 2]
#拆分通道
b, g, r = cv2.split(img)
也可以获取不同的通道
b = cv2.split(a)[0]
g = cv2.split(a)[1]
r = cv2.split(a)[2]
9、合并通道
图像通道合并主要调用merge()函数实现
m = cv2.merge([b, g, r])
10、均值滤波
result = cv2.blur(原始图像,核大小)
eg:
result = cv2.blur(source, (5,5))
核越大,越模糊,如果设置为(1,1)处理结果就是原图,核中每个权重值相同,称为均值。
11、方框滤波
方框滤波和均值滤波核基本一致,区别是需不需要均一化处理。OpenCV调用boxFilter()函数实现方框滤波。
函数如下:
result = cv2.boxFilter(原始图像, 目标图像深度, 核大小, normalize属性)
eg:
result = cv2.boxFilter(source, -1, (5,5), normalize=1)
其中,目标图像深度是int类型,通常用“-1”表示与原始图像一致;核大小主要包括(3,3)和(5,5)代码中使用5*5的核,normalize=1表示进行归一化处理,此时与均值滤波相同。如果省略参数normalize,则默认是进行归一化处理。如果normalize=0则不进行归一化处理,像素值为周围像素之和,图像更多为白色。此时,核应该设置小一点,白色区域才不会那么多。
12、高斯滤波
dst = cv2.GaussianBlur(src, ksize, sigmaX)
eg:
result = cv2.GaussianBlur(source, (3,3), 0)
其中,src表示原始图像,ksize表示核大小,sigmaX表示X方向方差。注意,核大小(N, N)必须是奇数,X方向方差主要控制权重。
核越大,越模糊
13、中值滤波
图像平滑里中值滤波的效果最好。
dst = cv2.medianBlur(src, ksize)
eg:
result = cv2.medianBlur(img, 3)
其中,src表示源文件,ksize表示核大小。核必须是大于1的奇数,如3、5、7等。
常用的窗口还有方形、十字形、圆形和环形。不同形状的窗口产生不同的滤波效果,方形和圆形窗口适合外轮廓线较长的物体图像,而十字形窗口对有尖顶角状的图像效果好。中值滤波对于消除孤立点和线段的干扰十分有用,尤其是对于二进噪声,但对消除高斯噪声的影响效果不佳。对于一些细节较多的复杂图像,可以多次使用不同的中值滤波。
14、OpenCV加法运算
目标图像 = cv2.add(图像1, 图像2)
此时结果是饱和运算,即:
当像素值<=255时,结果为“图像1+图像2”,例如:120+48=168
当像素值>255时,结果为255,例如:(255+64) = 255
result2 = cv2.add(img, test)
15、图像融合
result = cv2.addWeighted(src1, 1, src2, 1, 0)
图像融合:目标图像 = 图像1 * 系数1 + 图像2 * 系数2 + 亮度调节量
需要注意的是,两张融合的图像像素大小需要一致。
16、图像类型转换
result = cv2.cvtColor(src, cv2.COLOR_BGR2GRAY)
1、cv2.COLOR_BGR2GRAY 2、cv2.COLOR_BGR2RGB
3、cv2.COLOR_GRAY2BGR
17、图像缩放
result = cv2.resize(src, dsize[, result[. fx[, fy[, interpolation]]]])
eg:
result = cv2.resize(src, (200,100))
result = cv2.resize(src, (160,160))
result = cv2.resize(src, None, fx=0.5, fy=0.5)
其中src表示原始图像,dsize表示缩放大小,fx和fy也可以表示缩放大小倍数,他们两个(dsize或fx\fy)设置一个即可实现图像缩放。例如:
18、图像旋转
图像旋转主要调用getRotationMatrix2D()函数和warpAffine()函数实现
M = cv2.getRotationMatrix2D((cols/2, rows/2), 30, 1)
参数分别为:旋转中心、旋转度数、scale
rotated = cv2.warpAffine(src, M, (cols, rows))
参数分别为:原始图像、旋转参数、原始图像宽高
#原图的高、宽 以及通道数
rows, cols, channel = src.shape
#原图的高、宽 以及通道数
rows, cols, channel = src.shape
#绕图像的中心旋转
#参数:旋转中心 旋转度数 scale
M = cv2.getRotationMatrix2D((cols/2, rows/2), 30, 1)
#参数:原始图像 旋转参数 元素图像宽高
rotated = cv2.warpAffine(src, M, (cols, rows))
19、图像翻转
dst = cv2.flip(src, flipCode)
eg:
img1 = cv2.flip(src, 0)
img2 = cv2.flip(src, 1)
img3 = cv2.flip(src, -1)
其中src表示原始图像,flipCode表示翻转方向,如果flipCode为0,则以X轴为对称轴翻转,如果fliipCode>0则以Y轴为对称轴翻转,如果flipCode<0则在X轴、Y轴方向同时翻转。
20、图像平移
图像平移首先定义平移矩阵M,再调用warpAffine()函数实现平移
M = np.float32([[1, 0, x], [0, 1, y]])
shifted = cv2.warpAffine(image, M, (image.shape[1], image.shape[0]))
21、阈值化
图像的二值化或阈值化(Binarization)旨在提取图像中的目标物体,将背景以及噪声区分开来。通常会设定一个阈值T,通过T将图像的像素划分为两类:大于T的像素群和小于T的像素群。
当灰度Gray小于阈值T时,其像素设置为0,表示黑色;当灰度Gray大于或等于阈值T时,其Y值为255,表示白色。
Python OpenCV中提供了阈值函数threshold()实现二值化处理
retval, dst = cv2.threshold(src, thresh, maxval, type)
其中,retval-阈值、dst-源图像、threshold-阈值、dst-处理结果、maxval-最大值、type-类型
1、二进制阈值化
该方法先要选定一个特定的阈值量,比如127。
(1) 大于等于127的像素点的灰度值设定为最大值(如8位灰度值最大为255)
(2) 灰度值小于127的像素点的灰度值设定为0
例如,163->255,86->0,102->0,201->255。
关键字为 cv2.THRESH_BINARY
r, b = cv2.threshold(GrayImage, 127, 255, cv2.THRESH_BINARY)
2、反二进制阈值化
该方法与二进制阈值化方法相似,先要选定一个特定的灰度值作为阈值,比如127。
(1) 大于127的像素点的灰度值设定为0(以8位灰度图为例)
(2) 小于该阈值的灰度值设定为255
例如,163->0,86->255,102->255,201->0。
关键字为 cv2.THRESH_BINARY_INV
r, b = cv2.threshold(GrayImage, 127, 255, cv2.THRESH_BINARY_INV)
3、截断阈值化
该方法需要选定一个阈值,图像中大于该阈值的像素点被设定为该阈值,小于该阈值的保持不变,比如127。
(1) 大于等于127的像素点的灰度值设定为该阈值127
(2) 小于该阈值的灰度值不改变
例如,163->127,86->86,102->102,201->127。
关键字为 cv2.THRESH_TRUNC
r, b = cv2.threshold(GrayImage, 127, 255, cv2.THRESH_TRUNC)
4、阈值化为0
该方法先选定一个阈值,比如127
(1) 大于等于阈值127的像素点,值保持不变
(2) 小于该阈值的像素点值设置为0
例如,163->163,86->0,102->0,201->201。
关键字为 cv2.THRESH_TOZERO
r, b = cv2.threshold(GrayImage, 127, 255, cv2.THRESH_TOZERO)
5、 反阈值化为0
该方法先选定一个阈值,比如127
(1) 大于等于阈值127的像素点变为0
(2) 小于该阈值的像素点值保持不变
例如,163->0,86->86,102->102,201->0。
关键字为 cv2.THRESH_TOZERO_INV
r, b = cv2.threshold(GrayImage, 127, 255, cv2.THRESH_TOZERO_INV)
22、图像腐蚀
dst = cv2.erode(src, kernel, iterations)
eg:
#设置卷积核
kernel = np.ones((5,5), np.uint8)
#图像腐蚀处理
erosion = cv2.erode(src, kernel)
参数dst表示处理的结果,src表示原图像,kernel表示卷积核,iterations表示迭代次数。
23、图像膨胀
它也包括两个输入对象:
(1)二值图像或原始图像
(2)卷积核
卷积核是腐蚀中的关键数组,采用numpy库可以生成。
dst = cv2.dilate(src, kernel, iterations)
参数dst表示处理的结果,src表示原图像,kernel表示卷积核,iterations表示迭代次数。
24、开运算
dst = cv2.morphologyEx(src, cv2.MORPH_OPEN, kernel)
eg:
#设置卷积核
kernel = np.ones((5,5), np.uint8)
#图像开运算
result = cv2.morphologyEx(src, cv2.MORPH_OPEN, kernel)
参数dst表示处理的结果,src表示原图像,cv2.MORPH_OPEN表示开运算,kernel表示卷积核。
25、闭运算
dst = cv2.morphologyEx(src, cv2.MORPH_CLOSE, kernel)
eg:
#设置卷积核
kernel = np.ones((10,10), np.uint8)
#图像闭运算
result = cv2.morphologyEx(src, cv2.MORPH_CLOSE, kernel)
参数dst表示处理的结果,src表示原图像, cv2.MORPH_CLOSE表示闭运算,kernel表示卷积核。
26、梯度运算
dst = cv2.morphologyEx(src, cv2.MORPH_GRADIENT, kernel)
参数dst表示处理的结果,src表示原图像, cv2.MORPH_GRADIENT表示梯度运算,kernel表示卷积核。
27、顶帽运算
dst = cv2.morphologyEx(src, cv2.MORPH_TOPHAT, kernel)
参数dst表示处理的结果,src表示原图像,cv2.MORPH_TOPHAT表示顶帽运算,kernel表示卷积核。
28、黑帽运算
dst = cv2.morphologyEx(src, cv2.MORPH_BLACKHAT, kernel)
参数dst表示处理的结果,src表示原图像,cv2.MORPH_BLACKHAT表示黑帽运算,kernel表示卷积核。
29、opencv绘制直方图
hist = cv2.calcHist(images, channels, mask, histSize, ranges, accumulate)
eg:
hist = cv2.calcHist([src], [0], None, [256], [0,255])
参数:
hist表示直方图,返回的是一个二维数组
images表示原始图像
channels表示指定通道,通道编号需要用中括号括起,输入图像是灰度图像时,它的值为[0],彩色图像则为[0]、[1]、[2],分别表示B、G、R
mask表示掩码图像,统计整副图像的直方图,设为None,统计图像的某一部分直方图时,需要掩码图像
histSize表示BINS的数量,参数子集的数目,如下图当bins=3表示三个灰度级
ranges表示像素值范围,例如[0, 255]
accumulate表示累计叠加标识,默认为false,如果被设置为true,则直方图在开始分配时不会被清零,该参数允许从多个对象中计算单个直方图,或者用于实时更新直方图;多个直方图的累积结果用于对一组图像的直方图计算
30、图像仿射变换
M = cv2.getAffineTransform(pos1,pos2)
pos1表示变换前的位置
pos2表示变换后的位置
cv2.warpAffine(src, M, (cols, rows))
src表示原始图像
M表示仿射变换矩阵
(rows,cols)表示变换后的图像大小,rows表示行数,cols表示列数
#获取图像大小
rows, cols = src.shape[:2]
#设置图像仿射变换矩阵
pos1 = np.float32([[50,50], [200,50], [50,200]])
pos2 = np.float32([[10,100], [200,50], [100,250]])
M = cv2.getAffineTransform(pos1, pos2)
#图像仿射变换
result = cv2.warpAffine(src, M, (cols, rows))
31、图像透视变换
M = cv2.getPerspectiveTransform(pos1, pos2)
pos1表示透视变换前的4个点对应位置
pos2表示透视变换后的4个点对应位置
cv2.warpPerspective(src,M,(cols,rows))
src表示原始图像
M表示透视变换矩阵
(rows,cols)表示变换后的图像大小,rows表示行数,cols表示列数
numpy篇
1、numpy读取像素
返回值 = 图像.item(位置参数)
#Numpy读取像素
blue = img.item(78, 100, 0)
green = img.item(78, 100, 1)
red = img.item(78, 100, 2)
print(blue)
print(green)
print(red)
2、numpy修改像素
图像.itemset(位置, 新值)
eg:
img.itemset((88,99), 255)
3、定义矩阵
#定义300*100矩阵 3对应BGR
face = np.ones((200, 200, 3))
4、增加噪声
for i in range(5000):
x = np.random.randint(0, rows)
y = np.random.randint(0, cols)
img[x,y,:] = 255
5、Numpy库加法
其运算方法是:目标图像 = 图像1 + 图像2,运算结果进行取模运算。
当像素值<=255时,结果为“图像1+图像2”,例如:120+48=168
当像素值>255时,结果为对255取模的结果,例如:(255+64)%255=64
result1 = img + test
未完待续。。。