OpenCV的imgproc 模块:图像阈值处理 cv2.threshold、cv2.adaptiveThreshold ——OpenCV官方教程翻译(全网最详细)
一、目标
- 在本教程中,您将学习全局阈值化,自适应阈值化,Otsu阈值化等。
- 您将学习这些两个函数: cv2.threshold(), cv2.adaptiveThreshold()。
二、基本理论
什么是阈值?
-
它是一种最简单的图像分割的方法。
-
应用举例:从一副图像中利用阈值分割出我们需要的物体部分(当然这里的物体可以是一部分或者整体)。这样的图像分割方法是基于图像中物体与背景之间的灰度差异,而且此分割属于像素级的分割。
-
为了从一副图像中提取出我们需要的部分,应该用图像中的每一个像素点的灰度值与选取的阈值进行比较,并作出相应的判断。(注意:阈值的选取依赖于具体的问题。即:物体在不同的图像中有可能会有不同的灰度值。
-
一旦找到了需要分割的物体的像素点,我们可以对这些像素点设定一些特定的值来表示。(例如:可以将该物体的像素点的灰度值设定为:‘0’(黑色),其他的像素点的灰度值为:‘255’(白色);当然像素点的灰度值可以任意,但最好设定的两种颜色对比度较强,方便观察结果)。
2.1 阈值化的类型
-
OpenCV中提供了阈值化函数:
cv2.threshold()
、cv2.adaptiveThreshold()
。 -
这个函数有5种阈值化类型,在接下来的章节中将会具体介绍。
-
为了解释阈值分割的过程,我们来看一个简单有关像素灰度的图片,该图如下。该图中的蓝色水平线代表着具体的一个阈值。
2.1.1 二进制阈值化 cv2.THRESH_BINARY
- 该阈值化类型如下式所示::
- 解释:在运用该阈值类型的时候,先要选定一个特定的阈值量,比如:125,这样,新的阈值产生规则可以解释为大于125的像素点的灰度值设定为最大值(如8位灰度值最大为255),灰度值小于125的像素点的灰度值设定为0。
2.1.2 反二进制阈值化 cv2.THRESH_BINARY_INV
- 该阈值类型如下式所示:
- 解释:该阈值化与二进制阈值化相似,先选定一个特定的灰度值作为阈值,不过最后的设定值相反。(在8位灰度图中,例如大于阈值的设定为0,而小于该阈值的设定为255)
2.1.3 截断阈值化 cv2.THRESH_TRUNC
- 该阈值化类型如下式所示:
- 解释:同样首先需要选定一个阈值,图像中大于该阈值的像素点被设定为该阈值,小于该阈值的保持不变。(例如:阈值选取为125,那小于125的阈值不改变,大于125的灰度值(230)的像素点就设定为该阈值)。
2.1.4 阈值化为0 cv2.THRESH_TOZERO
- 该阈值类型如下式所示:
- 解释:先选定一个阈值,然后对图像做如下处理:1 像素点的灰度值大于该阈值的不进行任何改变;2 像素点的灰度值小于该阈值的,其灰度值全部变为0。
2.1.5反阈值化为0 cv2.THRESH_TOZERO_INV
- 该阈值类型如下式所示:
- 解释:原理类似于0阈值,但是在对图像做处理的时候相反,即:像素点的灰度值小于该阈值的不进行任何改变,而大于该阈值的部分,其灰度值全部变为0。
三、图像阈值化处理
3.1 全局阈值化处理函数cv2.threshold()
retval, dst = cv2.threshold ( InputArray src,
double thresh,
double maxval,
int type
)
参数 | 说明 |
---|---|
src | 输入图,输入数组(多通道,8位或32位浮点数),一般为灰度图。 |
dst | 输出图,与src具有相同大小和类型以及相同通道数量的输出数组。 |
thresh | 阈值,与THRESH_BINARY和THRESH_BINARY_INV阈值类型一起使用的最大值 |
maxval | 当像素值超过了阈值(或者小于阈值,根据type来决定),所赋予的值 |
type | 二值化操作的类型,阈值类型(参见ThresholdTypes)。 |
ThresholdTypes包含以下5种类型: cv2.THRESH_BINARY
; cv2.THRESH_BINARY_INV
; cv2.THRESH_TRUNC
; cv2.THRESH_TOZERO
;cv2.THRESH_TOZERO_INV
ThresholdTypes参数 | 说明 |
---|---|
cv2.THRESH_BINARY | 超过阈值部分取maxval(最大值),否则取0 |
cv2.THRESH_BINARY_INV | THRESH_BINARY的反转 |
cv2.THRESH_TRUNC | 大于阈值部分设为阈值,否则不变 |
cv2.THRESH_TOZERO | 大于阈值部分不改变,否则设为0 |
cv2.THRESH_TOZERO_INV | THRESH_TOZERO的反转 |
cv2.THRESH_MASK | |
cv2.THRESH_OTSU | 标志,使用Otsu算法选择最优阈值 |
cv2.THRESH_TRIANGLE | 标志,使用三角形算法选择最优阈值 |
对每个数组元素应用一个固定级别的阈值。
该函数对多通道阵列应用固定级别阈值。该函数通常用于从灰度图像中获得双级(二值)图像(compare也可用于此目的)或去除噪声,即过滤出值太小或太大的像素。该函数支持几种类型的阈值设置。它们由类型参数决定。
另外,特殊值THRESH_OTSU
或THRESH_TRIANGLE
可以与上述值中的一个结合使用。在这些情况下,函数使用Otsu的或Triangle算法确定最佳阈值。
注意:目前,Otsu和Triangle方法仅适用于8位的单通道图像。
3.1.1 举例演示
import cv2
import numpy as np
from matplotlib import pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] #文字字体为黑体
#彩色图像阈值化
img = cv2.imread('dog.jpg')
b,g,r = cv2.split(img)
img = cv2.merge((r,g,b)) #BGR转RGB
ret, thresh1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
ret, thresh2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)
ret, thresh3 = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)
ret, thresh4 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)
ret, thresh5 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)
titles = ['Original Image', 'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV']
images = [img, thresh1, thresh2, thresh3, thresh4, thresh5]
plt.figure()
for i in range(6):
plt.subplot(2, 3, i + 1), plt.imshow(images[i], 'gray')
plt.suptitle('彩色图像阈值化')
plt.title(titles[i])
plt.xticks([]), plt.yticks([])
plt.show()
运行结果:
注意:通过实践,cv2.threshold()
是可以处理BGR彩色图像的,而下文介绍的cv2.adaptiveThreshold()
不能处理彩色图像。但是在我的专业领域下,可能对彩色图像阈值化处理并没有多大意义,所以还是统一使用灰度图最为输入图像吧。
#灰度图像阈值化
img = cv2.imread('dog.jpg')
img_gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
ret, thresh1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY)
ret, thresh2 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY_INV)
ret, thresh3 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TRUNC)
ret, thresh4 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TOZERO)
ret, thresh5 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TOZERO_INV)
titles = ['Original Image', 'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV']
images = [img_gray, thresh1, thresh2, thresh3, thresh4, thresh5]
plt.figure()
for i in range(6):
plt.subplot(2, 3, i + 1), plt.imshow(images[i], 'gray')
plt.suptitle('灰度图像阈值化')
plt.title(titles[i])
plt.xticks([]), plt.yticks([])
plt.show()
运行结果:
3.2自适应阈值处理
在上一节中,我们使用全局值作为阈值。但它可能不是在所有的条件下,图像有不同的照明条件在不同的区域。在这种情况下,我们使用自适应阈值。在这种情况下,算法计算的阈值的小区域的图像。因此,我们对同一幅图像的不同区域得到了不同的阈值,对不同光照的图像得到了更好的结果。
它有三个“特殊的”输入参数,只有一个输出参数。
自适应方法-它决定如何阈值的计算。
ADAPTIVE_THRESH_MEAN_C
:阈值是相邻区域的均值。ADAPTIVE_THRESH_GAUSSIAN_C
:阈值是权重为高斯窗的邻域值的加权和。
3.2.1自适应阈值处理函数cv2.adaptiveThreshold()
dst = cv2.adaptiveThreshold ( InputArray src,
double maxValue,
int adaptiveMethod,
int thresholdType,
int blockSize,
double C
)
参数 | 说明 |
---|---|
src | 输入图,8位单通道图像 |
dst | 与src相同大小和类型的目标图像 |
maxValue | 赋给满足条件的像素的非零值 |
adaptiveMethod | 使用自适应阈值算法,请参见AdaptiveThresholdTypes。使用BORDER_REPLICATE, BORDER_ISOLATED来处理边界 |
thresholdType | 阈值类型必须为THRESH_BINARY或THRESH_BINARY_INV,请参见ThresholdTypes |
blockSize | 用于计算像素阈值的像素邻域大小:3、5、7,等等 |
C | 常数减去平均值或加权平均值(详见下文)。通常,它是正的,但也可以是零或负的 |
AdaptiveThresholdTypes
(自适应阈值算法参数)
AdaptiveThresholdTypes参数 | 说明 |
---|---|
cv2.ADAPTIVE_THRESH_MEAN_C | 阈值T(x,y)是(x,y) - C的blockSize×blockSize邻域的均值 |
cv2.ADAPTIVE_THRESH_GAUSSIAN_C | 阈值T(x,y)是(x,y) - C的blockSize×blockSize邻域的加权和(与高斯窗口相互关联)。指定的块大小使用默认的sigma(标准偏差)。见getGaussianKernel |
对数组应用自适应阈值。
该函数将灰度图像转换为二值图像,其公式如下:
- THRESH_BINARY:
- THRESH_BINARY_INV:
其中T(x,y)是为每个像素单独计算的阈值(见adaptiveMethod参数)。
该函数可以就地处理图像。
3.2.1.1举例演示
#自适应阈值处理
img = cv2.imread('dog.jpg')
img_gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
img = cv2.medianBlur(img_gray,5) #中值滤波平滑处理
ret,th1 = cv2.threshold(img,127,255,cv2.THRESH_BINARY) #全局图像阈值处理
th2 = cv2.adaptiveThreshold(img,255,cv2.ADAPTIVE_THRESH_MEAN_C,cv2.THRESH_BINARY,11,2) #自适应图像阈值处理
th3 = cv2.adaptiveThreshold(img,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C,cv2.THRESH_BINARY,11,2)
titles = ['Original Image', 'Global Thresholding (v = 127)',
'Adaptive Mean Thresholding', 'Adaptive Gaussian Thresholding']
images = [img, th1, th2, th3]
plt.figure()
for i in range(4):
plt.subplot(2,2,i+1),plt.imshow(images[i],'gray')
plt.title(titles[i])
plt.xticks([]),plt.yticks([])
plt.show()
运行结果:
通过对比可以看出,图2进行的全局统一阈值化处理的效果和图3、图4自适应阈值化处理的效果有很大的不同。
3.3 大津二值化算法 ( Otsu’s binarization )
在第一节中,函数返回值还有第二个参数retVal。当我们使用Otsu的二值化时,就会用到它。那么它是什么呢?
在全局阈值中,我们使用任意值作为阈值,那么,我们如何知道我们选择的值是好是坏呢?答案是,试错法。但是考虑一个双峰图像(简单地说,双峰图像是直方图有两个峰值的图像)。对于这个图像,我们可以在这些峰值中间取一个值作为阈值,这就是大津二值化所做的。因此,简单地说,它从图像直方图的双峰图像自动计算一个阈值。(对于非双峰的图像,二值化是不准确的)
为此,使用我们的cv2.threshold()
函数,但传递一个额外的标志cv2.THRESH_OTSU
。对于阈值,只需传递0即可。然后,该算法会找到最优阈值,并作为第二个输出retVal
返回给您。如果不使用Otsu阈值,则retVal与您使用的阈值相同。
3.3.1Otsu算法原理
由于我们使用的是双峰图像,Otsu的算法试图找到一个阈值(t),使由关系给出的加权类内方差最小:
其中:
它会找到一个t值位于两个峰值之间这样两类的方差都是最小的。
3.3.2举例演示
看看下面的例子。输入图像是有噪声的图像。在第一个例子中,我为127应用了全局阈值。在第二种情况中,我直接应用了Otsu的阈值。在第三种情况下,我用5x5高斯核滤除图像中的噪声,然后应用Otsu阈值。查看噪声滤波如何改善结果。
#大津二值化算法 ( Otsu's binarization )
img = cv2.imread('dog.jpg')
img = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) #转化为灰度图
# global thresholding
ret1,th1 = cv2.threshold(img,127,255,cv2.THRESH_BINARY) #全局图像阈值化处理
# Otsu's thresholding
ret2,th2 = cv2.threshold(img,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU) #Otsu算法阈值化
# Otsu's thresholding after Gaussian filtering
blur = cv2.GaussianBlur(img,(5,5),0) #高斯滤波
ret3,th3 = cv2.threshold(blur,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU) #高斯滤波之后,Otsu算法阈值化
# plot all the images and their histograms
images = [img, 0, th1,
img, 0, th2,
blur, 0, th3]
titles = ['Original Noisy Image','Histogram','Global Thresholding (v=127)',
'Original Noisy Image','Histogram',"Otsu's Thresholding",
'Gaussian filtered Image','Histogram',"Otsu's Thresholding"]
for i in range(3):
plt.subplot(3,3,i*3+1),plt.imshow(images[i*3],'gray')
plt.title(titles[i*3]), plt.xticks([]), plt.yticks([])
plt.subplot(3,3,i*3+2),plt.hist(images[i*3].ravel(),256)
plt.title(titles[i*3+1]), plt.xticks([]), plt.yticks([])
plt.subplot(3,3,i*3+3),plt.imshow(images[i*3+2],'gray')
plt.title(titles[i*3+2]), plt.xticks([]), plt.yticks([])
plt.show()
运行结果:
主要参考于OpenCV官方网站:http://www.opencv.org.cn/
目前博主已更新OpenCV平滑处理函数、形态学操作函数的详细介绍,链接如下:
【OpenCV-图像处理】图像平滑处理函数
<后续还会继续翻译和整理【OpenCV-图像处理】相关内容,如果需要,可持续关注我哦~> |
<翻译和整理不易,留个赞或评论支持一下我吧^^>
如有疑问,欢迎批评指正^^