7/26 opencv-python学习笔记

最新推荐文章于 2023-07-19 16:45:10 发布

用吉他弹奏摇滚乐

最新推荐文章于 2023-07-19 16:45:10 发布

阅读量222

点赞数

文章标签： opencv 计算机视觉 python

本文链接：https://blog.csdn.net/m0_45805664/article/details/107598515

版权

对比度增强

掩膜

刚开始涉及到图像处理的时候，在opencv等库中总会看到mask这么一个参数，非常的不理解，在查询一系列资料之后，写下它们，以供翻阅。

什么是掩膜（mask）

数字图像处理中的掩膜的概念是借鉴于PCB制版的过程，在半导体制造中，许多芯片工艺步骤采用光刻技术，用于这些步骤的图形“底片”称为掩膜（也称作“掩模”），其作用是：在硅片上选定的区域中对一个不透明的图形模板遮盖，继而下面的腐蚀或扩散将只影响选定的区域以外的区域。
图像掩膜与其类似，用选定的图像、图形或物体，对处理的图像（全部或局部）进行遮挡，来控制图像处理的区域或处理过程。
光学图像处理中,掩模可以是胶片、滤光片等。数字图像处理中,掩模为二维矩阵数组,有时也用多值图像。
数字图像处理中,图像掩模主要用于：
①提取感兴趣区,用预先制作的感兴趣区掩模与待处理图像相乘,得到感兴趣区图像,感兴趣区内图像值保持不变,而区外图像值都为0。
②屏蔽作用,用掩模对图像上某些区域作屏蔽,使其不参加处理或不参加处理参数的计算,或仅对屏蔽区作处理或统计。
③结构特征提取,用相似性变量或图像匹配方法检测和提取图像中与掩模相似的结构特征。
④特殊形状图像的制作。

掩膜是一种图像滤镜的模板，实用掩膜经常处理的是遥感图像。当提取道路或者河流，或者房屋时，通过一个n*n的矩阵来对图像进行像素过滤，然后将我们需要的地物或者标志突出显示出来。
详细讲解链接：
https://blog.csdn.net/Gavinmiaoc/article/details/80856246?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-4.channel_param&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-4.channel_param

对比度增强

对比度增强，即将图片的灰度范围拉宽，如图片灰度分布范围在[50,150]之间，将其范围拉升到[0,256]之间。这里介绍下线性变换，直方图正规化，伽马变换，全局直方图均衡化，限制对比度自适应直方图均衡化等算法。

astype：转换数组的数据类型

int32 --> float64 完全ojbk

float64 --> int32 会将小数部分截断

string_ --> float64 如果字符串数组表示的全是数字，也可以用astype转化为数值类型
实例：

x = np.array([1, 2, 2.5])
x.astype(int)

结果

输出：array([1, 2, 2])

numpy中常用的数学和统计函数

numpy模块的核心就是基于数组的运算，相比于列表和其他数据结构，数组的运算效率是最高的。在统计分析和挖掘过程中，经常会使用到numpy模块的函数，以下是常用的数学函数和统计函数：
在这里插入图片描述 常数p就是圆周率 3.1415926…
常数e ：2.71828…
np.fabs(arr) 例如：np.fabs(-3) 输出：3.0
np.ceil(arr) 例如：np.ceil(3.2) 输出：4.0 并非四舍五入操作
np.floor(arr) 类似ceil 向下取整
np.round(arr) 四舍五入例如：np.round(3.4) 输入：3.0 输出的还是浮点型数据，并非整型
np.fmod(arr1,arr2) 求余，对arr1，arr2并没有要求要整数,如np.fmod(3.9,3.8) 结果是：0.1000000

线性变换

通过函数y=ax+b对灰度值进行处理，例如对于过暗的图片，其灰度分布在[0,100], 选择a=2,b=10能将灰度范围拉伸到[10, 210]。可以通过np或者opencv的convertScaleAbs()函数来实现，对应参数列表如下：

cv2.convertScaleAbs(src,alpha,beta)
    src: 图像对象矩阵
　　 dst:输出图像矩阵
    alpha:y=ax+b中的a值
    beta:y=ax+b中的b值
    (对于计算后大于255的像素值会截断为255)

使用示例代码和效果图如下：

import cv2 as cv
import matplotlib.pyplot as plt
import numpy as np

img = cv.imread(r"D:\0725222253.png")
print(img)
img_bright = cv.convertScaleAbs(img,alpha=1.5,beta=0)
print(img_bright)

cv.imshow("img",img)
cv.imshow("img_bright",img_bright)
cv.waitKey(0)
cv.destroyAllWindows()

import cv2 as cv
import matplotlib.pyplot as plt
import numpy as np

img = cv.imread(r"D:\0725222253.png")
a=1.5
b=0
y = np.float(a)*img+b
y[y>255]=255
y = np.round(y)
img_bright= y.astype(np.uint8)

cv.imshow("img",img)
cv.imshow("img_bright",img_bright)
cv.waitKey(0)
cv.destroyAllWindows()

在这里插入图片描述
实用性：numpy自定义实现时，可以针对不同区间像素点，采用不同系数a，b来动态改变像素值

直方图正规化

对于上述线性变换，系数a，b需要自己摸索设置。直方图正规化的系数固定，一般将原图片的像素值范围映射到[0,255]范围内。假设原图片的像素值分布范围为Input：[min, max], 映射后的范围为Output：[0,255], 则对应的系数a=（255-0）/(max-min), 系数b=0。即计算公式：
在这里插入图片描述
opencv提供了normalize()函数来实现灰度正规化，对应参数列表如下：

cv2.normalize(src,dst,alpha,beta,normType,dtype,mask)
        参数：
        src: 图像对象矩阵
        dst:输出图像矩阵（和src的shape一样）
        alpha:正规化的值，如果是范围值，为范围的下限 （alpha – norm value to normalize to or the lower range boundary in case of the range normalization.）
        beta:如果是范围值，为范围的上限；正规化中不用到 （ upper range boundary in case of the range normalization; it is not used for the norm normalization.）
        norm_type:normalize的类型
                    cv2.NORM_L1:将像素矩阵的1-范数做为最大值（矩阵中值的绝对值的和）
                    cv2.NORM_L2：将像素矩阵的2-范数做为最大值（矩阵中值的平方和的开方）
                    cv2.NORM_MINMAX：将像素矩阵的∞-范数做为最大值 （矩阵中值的绝对值的最大值）
                    
        dtype: 输出图像矩阵的数据类型，默认为-1，即和src一样
        mask：掩模矩阵,只对感兴趣的地方归一化

对于alpha的值，不是很清楚含义，经过试验，应该是一个锚点，用像素矩阵中的范数计算出来的比例和alpha相乘，当dtype为cv2.NORM_MINMAX时，其计算公式类似如下：
在这里插入图片描述
使用示例代码和效果图如下：

import cv2 as cv
import matplotlib.pyplot as plt
import numpy as np

img = cv.imread(r"C:\Users\Administrator\Desktop\dark.jpg")
img_norm=cv.normalize(img,dst=None,alpha=350,beta=10,norm_type=cv.NORM_MINMAX)
cv.imshow("img",img)
cv.imshow("img_norm",img_norm)
cv.waitKey(0)
cv.destroyAllWindows()

numpy实现

import cv2 as cv
import matplotlib.pyplot as plt
import numpy as np

img = cv.imread(r"C:\Users\Administrator\Desktop\dark.jpg")
out_min=0
out_max=255

in_min = np.min(img)
in_max = np.max(img)

a=float(out_max-out_min)/(in_max-in_min)
b=out_min-a*in_min
img_norm = img*a+b
img_norm = img_norm.astype(np.uint8)
cv.imshow("img",img)
cv.imshow("img_norm",img_norm)
cv.waitKey(0)
cv.destroyAllWindows()

在这里插入图片描述

伽马变换

将输入图像的像素值除以255，归一化到[0,1]区间，然后计算其γ次方值，用公式表示如下，其中I(r,c)为归一化后的像素值，当γ=1时原像素值不影响，当0<γ<1时，增大像素值，提高图片对比度；反之γ>1时能降低图片对比度。

在这里插入图片描述

　实现代码和示例如下：

import cv2 as cv
import matplotlib.pyplot as plt
import numpy as np

img = cv.imread(r"C:\Users\Administrator\Desktop\dark.jpg")
img_norm = img/255.0  #注意255.0得采用浮点数
img_gamma = np.power(img_norm,0.4)*255.0
img_gamma = img_gamma.astype(np.uint8)

cv.imshow("img",img)
cv.imshow("img_gamma",img_gamma)
cv.waitKey(0)
cv.destroyAllWindows()

在这里插入图片描述

全局直方图均衡化

直方图均衡化的目的是将原图片每个像素值的像素点个数进行重新分配到[0,255]的256个像素值上，使得每个像素值对应的像素点个数近似相等，即重新分配后，0-255的每个像素值对应的像素点个数近似为(rows*cols/256)，(直方图均衡化对应的数学原理参考:https://blog.csdn.net/superjunenaruto/article/details/52431941)。opencv里面equalizeHist()函数实现了相应的功能，只能处理单通道数据，参数列表如下：

cv2.equalizeHist(src,dst)
        src: 图像对象矩阵,必须为单通道的uint8类型的矩阵数据
        dst:输出图像矩阵（和src的shape一样）

实现代码和示例如下：

import cv2 as cv
import matplotlib.pyplot as plt
import numpy as np
import math

img = cv.imread(r"C:\Users\Administrator\Desktop\dark.jpg",0)
img_equalize = cv.equalizeHist(img)
cv.imshow("img",img)
cv.imshow("img_equalize",img_equalize)
cv.waitKey(0)
cv.destroyAllWindows()