【python图像处理】处理图像有关函数

最新推荐文章于 2023-03-25 20:29:46 发布

Ray_Songaaa

最新推荐文章于 2023-03-25 20:29:46 发布

阅读量763

点赞数

本文链接：https://blog.csdn.net/Ray_Songaaa/article/details/107506200

版权

opencv篇

1、opencv读取图像

img = cv2.imread(文件名,[,参数])

参数(1) cv2.IMREAD_UNCHANGED (图像不可变)
参数(2) cv2.IMREAD_GRAYSCALE (灰度图像)
参数(3) cv2.IMREAD_COLOR (读入彩色图像)
参数(4) cv2.COLOR_BGR2RGB (图像通道BGR转成RGB)

2、opencv显示图像

cv2.imshow("窗口名", 图像名)

3、窗口等待

cv2.waitKey(delay)

键盘绑定函数，共一个参数，表示等待毫秒数，将等待特定的几毫秒，看键盘是否有输入，返回值为ASCII值。如果其参数为0，则表示无限期的等待键盘输入；参数>0表示等待delay毫秒；参数<0表示等待键盘单击。

4、删除窗口

cv2.destroyAllWindows()

删除所有窗口

cv2.destroyWindows()

删除指定的窗口

5、写入图片

retval = cv2.imwrite("文件地址", 图像名)

6、读取像素

eg:
test=img[88,42]
print（test）

灰度图像：返回值 = 图像(位置参数)

eg: 
blue=img[88,142,0] green=img[88,142,1] red=img[88,142,2]
print(blue)
print(green)
print(red)

彩色图像：返回值 = 图像[位置元素, 0 | 1 | 2 ] 获取BGR三个通道像素

注意OpenCV读取图像通道是BGR，也可以转换成RGB在进行处理

7、修改像素

修改图像如果是灰度图像则直接赋值新像素即可，彩色图像依次给三个值赋值即可。

img[88,142] = 255

灰度图像：

#方法一
img[88,142, 0] = 255
img[88,142, 1] = 255
img[88,142, 2] = 255
#方法2
img[88,142] = [255, 255, 255]

彩色图像

img[100:200, 150:250] = [255,255,255]

局部修改，将行为100到200、列150到250的像素区域设置为白色。

8、拆分通道

OpenCV读取的彩色图像由B、G、R三原色组成，可以通过下面代码获取不同的通道。
b = img[:, :, 0]
g = img[:, :, 1]
r = img[:, :, 2]

#拆分通道
b, g, r = cv2.split(img)

也可以获取不同的通道

b = cv2.split(a)[0] 
g = cv2.split(a)[1] 
r = cv2.split(a)[2]

9、合并通道

图像通道合并主要调用merge()函数实现

m = cv2.merge([b, g, r])

10、均值滤波

result = cv2.blur(原始图像,核大小)
eg:
result = cv2.blur(source, (5,5))

核越大，越模糊，如果设置为（1，1）处理结果就是原图，核中每个权重值相同，称为均值。

11、方框滤波

方框滤波和均值滤波核基本一致，区别是需不需要均一化处理。OpenCV调用boxFilter()函数实现方框滤波。
函数如下：

result = cv2.boxFilter(原始图像, 目标图像深度, 核大小, normalize属性)
eg:
result = cv2.boxFilter(source, -1, (5,5), normalize=1)

其中，目标图像深度是int类型，通常用“-1”表示与原始图像一致；核大小主要包括（3，3）和（5，5）代码中使用5*5的核，normalize=1表示进行归一化处理，此时与均值滤波相同。如果省略参数normalize，则默认是进行归一化处理。如果normalize=0则不进行归一化处理，像素值为周围像素之和，图像更多为白色。此时，核应该设置小一点，白色区域才不会那么多。

12、高斯滤波

dst = cv2.GaussianBlur(src, ksize, sigmaX)
eg:
result = cv2.GaussianBlur(source, (3,3), 0)

其中，src表示原始图像，ksize表示核大小，sigmaX表示X方向方差。注意，核大小（N, N）必须是奇数，X方向方差主要控制权重。
核越大，越模糊

13、中值滤波

图像平滑里中值滤波的效果最好。

dst = cv2.medianBlur(src, ksize)
eg:
result = cv2.medianBlur(img, 3)

其中，src表示源文件，ksize表示核大小。核必须是大于1的奇数，如3、5、7等。

常用的窗口还有方形、十字形、圆形和环形。不同形状的窗口产生不同的滤波效果，方形和圆形窗口适合外轮廓线较长的物体图像，而十字形窗口对有尖顶角状的图像效果好。中值滤波对于消除孤立点和线段的干扰十分有用，尤其是对于二进噪声，但对消除高斯噪声的影响效果不佳。对于一些细节较多的复杂图像，可以多次使用不同的中值滤波。

14、OpenCV加法运算

目标图像 = cv2.add(图像1, 图像2)
此时结果是饱和运算，即：

当像素值<=255时，结果为“图像1+图像2”，例如：120+48=168
当像素值>255时，结果为255，例如：(255+64) = 255

result2 = cv2.add(img, test)

15、图像融合

result = cv2.addWeighted(src1, 1, src2, 1, 0)

图像融合：目标图像 = 图像1 * 系数1 + 图像2 * 系数2 + 亮度调节量
需要注意的是，两张融合的图像像素大小需要一致。

16、图像类型转换

result = cv2.cvtColor(src, cv2.COLOR_BGR2GRAY)

1、cv2.COLOR_BGR2GRAY 2、cv2.COLOR_BGR2RGB
3、cv2.COLOR_GRAY2BGR

17、图像缩放

result = cv2.resize(src, dsize[, result[. fx[, fy[, interpolation]]]])
eg:
result = cv2.resize(src, (200,100))
result = cv2.resize(src, (160,160))
result = cv2.resize(src, None, fx=0.5, fy=0.5)

其中src表示原始图像，dsize表示缩放大小，fx和fy也可以表示缩放大小倍数，他们两个（dsize或fx\fy）设置一个即可实现图像缩放。例如：

18、图像旋转

图像旋转主要调用getRotationMatrix2D()函数和warpAffine()函数实现

M = cv2.getRotationMatrix2D((cols/2, rows/2), 30, 1)

参数分别为：旋转中心、旋转度数、scale

rotated = cv2.warpAffine(src, M, (cols, rows))

参数分别为：原始图像、旋转参数、原始图像宽高
#原图的高、宽以及通道数
rows, cols, channel = src.shape

#原图的高、宽 以及通道数
rows, cols, channel = src.shape
#绕图像的中心旋转
#参数：旋转中心 旋转度数 scale
M = cv2.getRotationMatrix2D((cols/2, rows/2), 30, 1)
#参数：原始图像 旋转参数 元素图像宽高
rotated = cv2.warpAffine(src, M, (cols, rows))

19、图像翻转

dst = cv2.flip(src, flipCode)
eg:
img1 = cv2.flip(src, 0)
img2 = cv2.flip(src, 1)
img3 = cv2.flip(src, -1)

其中src表示原始图像，flipCode表示翻转方向，如果flipCode为0，则以X轴为对称轴翻转，如果fliipCode>0则以Y轴为对称轴翻转，如果flipCode<0则在X轴、Y轴方向同时翻转。

20、图像平移

图像平移首先定义平移矩阵M，再调用warpAffine()函数实现平移

M = np.float32([[1, 0, x], [0, 1, y]])
shifted = cv2.warpAffine(image, M, (image.shape[1], image.shape[0]))

21、阈值化

图像的二值化或阈值化（Binarization）旨在提取图像中的目标物体，将背景以及噪声区分开来。通常会设定一个阈值T，通过T将图像的像素划分为两类：大于T的像素群和小于T的像素群。
当灰度Gray小于阈值T时，其像素设置为0，表示黑色；当灰度Gray大于或等于阈值T时，其Y值为255，表示白色。
Python OpenCV中提供了阈值函数threshold()实现二值化处理

retval, dst = cv2.threshold(src, thresh, maxval, type)

其中，retval-阈值、dst-源图像、threshold-阈值、dst-处理结果、maxval-最大值、type-类型

1、二进制阈值化

该方法先要选定一个特定的阈值量，比如127。
(1) 大于等于127的像素点的灰度值设定为最大值（如8位灰度值最大为255）
(2) 灰度值小于127的像素点的灰度值设定为0
例如，163->255，86->0，102->0，201->255。

关键字为 cv2.THRESH_BINARY

r, b = cv2.threshold(GrayImage, 127, 255, cv2.THRESH_BINARY)

2、反二进制阈值化

该方法与二进制阈值化方法相似，先要选定一个特定的灰度值作为阈值，比如127。
(1) 大于127的像素点的灰度值设定为0（以8位灰度图为例）
(2) 小于该阈值的灰度值设定为255
例如，163->0，86->255，102->255，201->0。

关键字为 cv2.THRESH_BINARY_INV

r, b = cv2.threshold(GrayImage, 127, 255, cv2.THRESH_BINARY_INV)

3、截断阈值化

该方法需要选定一个阈值，图像中大于该阈值的像素点被设定为该阈值，小于该阈值的保持不变，比如127。
(1) 大于等于127的像素点的灰度值设定为该阈值127
(2) 小于该阈值的灰度值不改变
例如，163->127，86->86，102->102，201->127。

关键字为 cv2.THRESH_TRUNC

r, b = cv2.threshold(GrayImage, 127, 255, cv2.THRESH_TRUNC)

4、阈值化为0

该方法先选定一个阈值，比如127
(1) 大于等于阈值127的像素点，值保持不变
(2) 小于该阈值的像素点值设置为0
例如，163->163，86->0，102->0，201->201。

关键字为 cv2.THRESH_TOZERO

r, b = cv2.threshold(GrayImage, 127, 255, cv2.THRESH_TOZERO)

5、反阈值化为0

该方法先选定一个阈值，比如127
(1) 大于等于阈值127的像素点变为0
(2) 小于该阈值的像素点值保持不变
例如，163->0，86->86，102->102，201->0。

关键字为 cv2.THRESH_TOZERO_INV

r, b = cv2.threshold(GrayImage, 127, 255, cv2.THRESH_TOZERO_INV)

22、图像腐蚀

dst = cv2.erode(src, kernel, iterations)
eg:
#设置卷积核
kernel = np.ones((5,5), np.uint8)
#图像腐蚀处理
erosion = cv2.erode(src, kernel)

参数dst表示处理的结果，src表示原图像，kernel表示卷积核，iterations表示迭代次数。

23、图像膨胀

它也包括两个输入对象：
(1)二值图像或原始图像
(2)卷积核
卷积核是腐蚀中的关键数组，采用numpy库可以生成。

dst = cv2.dilate(src, kernel, iterations)

参数dst表示处理的结果，src表示原图像，kernel表示卷积核，iterations表示迭代次数。

24、开运算

dst = cv2.morphologyEx(src, cv2.MORPH_OPEN, kernel)
eg:
#设置卷积核
kernel = np.ones((5,5), np.uint8)
#图像开运算
result = cv2.morphologyEx(src, cv2.MORPH_OPEN, kernel)

参数dst表示处理的结果，src表示原图像，cv2.MORPH_OPEN表示开运算，kernel表示卷积核。

25、闭运算

dst = cv2.morphologyEx(src, cv2.MORPH_CLOSE, kernel)
eg:
#设置卷积核
kernel = np.ones((10,10), np.uint8)
#图像闭运算
result = cv2.morphologyEx(src, cv2.MORPH_CLOSE, kernel)

参数dst表示处理的结果，src表示原图像， cv2.MORPH_CLOSE表示闭运算，kernel表示卷积核。

26、梯度运算

dst = cv2.morphologyEx(src, cv2.MORPH_GRADIENT, kernel)

参数dst表示处理的结果，src表示原图像， cv2.MORPH_GRADIENT表示梯度运算，kernel表示卷积核。

27、顶帽运算

dst = cv2.morphologyEx(src, cv2.MORPH_TOPHAT, kernel)

参数dst表示处理的结果，src表示原图像，cv2.MORPH_TOPHAT表示顶帽运算，kernel表示卷积核。

28、黑帽运算

dst = cv2.morphologyEx(src, cv2.MORPH_BLACKHAT, kernel)

参数dst表示处理的结果，src表示原图像，cv2.MORPH_BLACKHAT表示黑帽运算，kernel表示卷积核。

29、opencv绘制直方图

hist = cv2.calcHist(images, channels, mask, histSize, ranges, accumulate)
eg:
hist = cv2.calcHist([src], [0], None, [256], [0,255])

参数：
hist表示直方图，返回的是一个二维数组
images表示原始图像
channels表示指定通道，通道编号需要用中括号括起，输入图像是灰度图像时，它的值为[0]，彩色图像则为[0]、[1]、[2]，分别表示B、G、R
mask表示掩码图像，统计整副图像的直方图，设为None，统计图像的某一部分直方图时，需要掩码图像
histSize表示BINS的数量，参数子集的数目，如下图当bins=3表示三个灰度级
ranges表示像素值范围，例如[0, 255]
accumulate表示累计叠加标识，默认为false，如果被设置为true，则直方图在开始分配时不会被清零，该参数允许从多个对象中计算单个直方图，或者用于实时更新直方图；多个直方图的累积结果用于对一组图像的直方图计算

30、图像仿射变换

M = cv2.getAffineTransform(pos1,pos2)

pos1表示变换前的位置
pos2表示变换后的位置

cv2.warpAffine(src, M, (cols, rows))

src表示原始图像
M表示仿射变换矩阵
(rows,cols)表示变换后的图像大小，rows表示行数，cols表示列数

#获取图像大小
rows, cols = src.shape[:2]
#设置图像仿射变换矩阵
pos1 = np.float32([[50,50], [200,50], [50,200]])
pos2 = np.float32([[10,100], [200,50], [100,250]])
M = cv2.getAffineTransform(pos1, pos2)
#图像仿射变换
result = cv2.warpAffine(src, M, (cols, rows))

31、图像透视变换

 M = cv2.getPerspectiveTransform(pos1, pos2)

pos1表示透视变换前的4个点对应位置
pos2表示透视变换后的4个点对应位置

cv2.warpPerspective(src,M,(cols,rows))

src表示原始图像
M表示透视变换矩阵
(rows,cols)表示变换后的图像大小，rows表示行数，cols表示列数

numpy篇

1、numpy读取像素

返回值 = 图像.item(位置参数)

#Numpy读取像素
blue = img.item(78, 100, 0)
green = img.item(78, 100, 1)
red = img.item(78, 100, 2)
print(blue)
print(green)
print(red)

2、numpy修改像素

图像.itemset(位置, 新值)

eg：
img.itemset((88,99), 255)

3、定义矩阵

#定义300*100矩阵 3对应BGR
face = np.ones((200, 200, 3))

4、增加噪声

for i in range(5000):    
    x = np.random.randint(0, rows) 
    y = np.random.randint(0, cols)    
    img[x,y,:] = 255

5、Numpy库加法

其运算方法是：目标图像 = 图像1 + 图像2，运算结果进行取模运算。

当像素值<=255时，结果为“图像1+图像2”，例如：120+48=168
当像素值>255时，结果为对255取模的结果，例如：(255+64)%255=64

result1 = img + test

未完待续。。。