【OpenCV-图像处理】图像阈值处理——OpenCV官方教程翻译（全网最详细）

最新推荐文章于 2023-03-22 15:43:23 发布

路遥_.

最新推荐文章于 2023-03-22 15:43:23 发布

阅读量553

点赞数 1

分类专栏： OpenCV图像处理文章标签： opencv 计算机视觉 python 算法

本文链接：https://blog.csdn.net/weixin_45954454/article/details/114692395

版权

OpenCV图像处理专栏收录该内容

11 篇文章 6 订阅

订阅专栏

OpenCV的imgproc 模块：图像阈值处理 cv2.threshold、cv2.adaptiveThreshold ——OpenCV官方教程翻译（全网最详细）

一、目标
二、基本理论
- 2.1 阈值化的类型
三、图像阈值化处理

一、目标

在本教程中，您将学习全局阈值化，自适应阈值化，Otsu阈值化等。
您将学习这些两个函数: cv2.threshold(), cv2.adaptiveThreshold()。

二、基本理论

什么是阈值？

它是一种最简单的图像分割的方法。
应用举例：从一副图像中利用阈值分割出我们需要的物体部分（当然这里的物体可以是一部分或者整体）。这样的图像分割方法是基于图像中物体与背景之间的灰度差异，而且此分割属于像素级的分割。
为了从一副图像中提取出我们需要的部分，应该用图像中的每一个像素点的灰度值与选取的阈值进行比较，并作出相应的判断。（注意：阈值的选取依赖于具体的问题。即：物体在不同的图像中有可能会有不同的灰度值。
一旦找到了需要分割的物体的像素点，我们可以对这些像素点设定一些特定的值来表示。（例如：可以将该物体的像素点的灰度值设定为：‘0’（黑色）,其他的像素点的灰度值为：‘255’（白色）；当然像素点的灰度值可以任意，但最好设定的两种颜色对比度较强，方便观察结果）。

2.1 阈值化的类型

OpenCV中提供了阈值化函数： cv2.threshold() 、cv2.adaptiveThreshold()。
这个函数有5种阈值化类型，在接下来的章节中将会具体介绍。
为了解释阈值分割的过程，我们来看一个简单有关像素灰度的图片，该图如下。该图中的蓝色水平线代表着具体的一个阈值。

2.1.1 二进制阈值化 cv2.THRESH_BINARY

该阈值化类型如下式所示:：
解释：在运用该阈值类型的时候，先要选定一个特定的阈值量，比如：125，这样，新的阈值产生规则可以解释为大于125的像素点的灰度值设定为最大值(如8位灰度值最大为255)，灰度值小于125的像素点的灰度值设定为0。

2.1.2 反二进制阈值化 cv2.THRESH_BINARY_INV

该阈值类型如下式所示：
解释：该阈值化与二进制阈值化相似，先选定一个特定的灰度值作为阈值，不过最后的设定值相反。（在8位灰度图中，例如大于阈值的设定为0，而小于该阈值的设定为255）

2.1.3 截断阈值化 cv2.THRESH_TRUNC

该阈值化类型如下式所示：
解释：同样首先需要选定一个阈值，图像中大于该阈值的像素点被设定为该阈值，小于该阈值的保持不变。（例如：阈值选取为125，那小于125的阈值不改变，大于125的灰度值（230）的像素点就设定为该阈值）。

2.1.4 阈值化为0 cv2.THRESH_TOZERO

该阈值类型如下式所示：
解释：先选定一个阈值，然后对图像做如下处理：1 像素点的灰度值大于该阈值的不进行任何改变；2 像素点的灰度值小于该阈值的，其灰度值全部变为0。

2.1.5反阈值化为0 cv2.THRESH_TOZERO_INV

该阈值类型如下式所示：

在这里插入图片描述

解释：原理类似于0阈值，但是在对图像做处理的时候相反，即：像素点的灰度值小于该阈值的不进行任何改变，而大于该阈值的部分，其灰度值全部变为0。

三、图像阈值化处理

3.1 全局阈值化处理函数cv2.threshold()

retval, dst = cv2.threshold	(	InputArray 	src,
								double 	thresh,
								double 	maxval,
								int 	type 
)

参数	说明
src	输入图，输入数组(多通道，8位或32位浮点数)，一般为灰度图。
dst	输出图,与src具有相同大小和类型以及相同通道数量的输出数组。
thresh	阈值,与THRESH_BINARY和THRESH_BINARY_INV阈值类型一起使用的最大值
maxval	当像素值超过了阈值（或者小于阈值，根据type来决定），所赋予的值
type	二值化操作的类型，阈值类型(参见ThresholdTypes)。

ThresholdTypes包含以下5种类型： cv2.THRESH_BINARY； cv2.THRESH_BINARY_INV； cv2.THRESH_TRUNC； cv2.THRESH_TOZERO；cv2.THRESH_TOZERO_INV

ThresholdTypes参数	说明
cv2.THRESH_BINARY	超过阈值部分取maxval（最大值），否则取0
cv2.THRESH_BINARY_INV	THRESH_BINARY的反转
cv2.THRESH_TRUNC	大于阈值部分设为阈值，否则不变
cv2.THRESH_TOZERO	大于阈值部分不改变，否则设为0
cv2.THRESH_TOZERO_INV	THRESH_TOZERO的反转
cv2.THRESH_MASK
cv2.THRESH_OTSU	标志，使用Otsu算法选择最优阈值
cv2.THRESH_TRIANGLE	标志，使用三角形算法选择最优阈值

对每个数组元素应用一个固定级别的阈值。

该函数对多通道阵列应用固定级别阈值。该函数通常用于从灰度图像中获得双级(二值)图像(compare也可用于此目的)或去除噪声，即过滤出值太小或太大的像素。该函数支持几种类型的阈值设置。它们由类型参数决定。

另外，特殊值THRESH_OTSU或THRESH_TRIANGLE可以与上述值中的一个结合使用。在这些情况下，函数使用Otsu的或Triangle算法确定最佳阈值。

注意：目前，Otsu和Triangle方法仅适用于8位的单通道图像。

3.1.1 举例演示

import cv2 
import numpy as np
from matplotlib import pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']        #文字字体为黑体

#彩色图像阈值化
img = cv2.imread('dog.jpg')
b,g,r = cv2.split(img)
img = cv2.merge((r,g,b))	#BGR转RGB

ret, thresh1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
ret, thresh2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)
ret, thresh3 = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)
ret, thresh4 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)
ret, thresh5 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)

titles = ['Original Image', 'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV']
images = [img, thresh1, thresh2, thresh3, thresh4, thresh5]

plt.figure()
for i in range(6):
    plt.subplot(2, 3, i + 1), plt.imshow(images[i], 'gray')
    plt.suptitle('彩色图像阈值化')
    plt.title(titles[i])
    plt.xticks([]), plt.yticks([])
plt.show()

运行结果：在这里插入图片描述
注意：通过实践，cv2.threshold()是可以处理BGR彩色图像的，而下文介绍的cv2.adaptiveThreshold()不能处理彩色图像。但是在我的专业领域下，可能对彩色图像阈值化处理并没有多大意义，所以还是统一使用灰度图最为输入图像吧。

#灰度图像阈值化
img = cv2.imread('dog.jpg')
img_gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

ret, thresh1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY)
ret, thresh2 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY_INV)
ret, thresh3 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TRUNC)
ret, thresh4 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TOZERO)
ret, thresh5 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TOZERO_INV)

titles = ['Original Image', 'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV']
images = [img_gray, thresh1, thresh2, thresh3, thresh4, thresh5]

plt.figure()
for i in range(6):
    plt.subplot(2, 3, i + 1), plt.imshow(images[i], 'gray')
    plt.suptitle('灰度图像阈值化')
    plt.title(titles[i])
    plt.xticks([]), plt.yticks([])
plt.show()

运行结果：
在这里插入图片描述

3.2自适应阈值处理

在上一节中，我们使用全局值作为阈值。但它可能不是在所有的条件下，图像有不同的照明条件在不同的区域。在这种情况下，我们使用自适应阈值。在这种情况下，算法计算的阈值的小区域的图像。因此，我们对同一幅图像的不同区域得到了不同的阈值，对不同光照的图像得到了更好的结果。

它有三个“特殊的”输入参数，只有一个输出参数。

自适应方法-它决定如何阈值的计算。

ADAPTIVE_THRESH_MEAN_C:阈值是相邻区域的均值。
ADAPTIVE_THRESH_GAUSSIAN_C:阈值是权重为高斯窗的邻域值的加权和。

3.2.1自适应阈值处理函数cv2.adaptiveThreshold()

dst = cv2.adaptiveThreshold	(	InputArray 	src,
								double 	maxValue,
								int 	adaptiveMethod,
								int 	thresholdType,
								int 	blockSize,
								double 	C 
)

参数	说明
src	输入图，8位单通道图像
dst	与src相同大小和类型的目标图像
maxValue	赋给满足条件的像素的非零值
adaptiveMethod	使用自适应阈值算法，请参见AdaptiveThresholdTypes。使用BORDER_REPLICATE, BORDER_ISOLATED来处理边界
thresholdType	阈值类型必须为THRESH_BINARY或THRESH_BINARY_INV，请参见ThresholdTypes
blockSize	用于计算像素阈值的像素邻域大小:3、5、7，等等
C	常数减去平均值或加权平均值(详见下文)。通常，它是正的，但也可以是零或负的

AdaptiveThresholdTypes（自适应阈值算法参数）

AdaptiveThresholdTypes参数	说明
cv2.ADAPTIVE_THRESH_MEAN_C	阈值T(x,y)是(x,y) - C的blockSize×blockSize邻域的均值
cv2.ADAPTIVE_THRESH_GAUSSIAN_C	阈值T(x,y)是(x,y) - C的blockSize×blockSize邻域的加权和(与高斯窗口相互关联)。指定的块大小使用默认的sigma(标准偏差)。见getGaussianKernel

对数组应用自适应阈值。
该函数将灰度图像转换为二值图像，其公式如下:

THRESH_BINARY:
THRESH_BINARY_INV:

其中T(x,y)是为每个像素单独计算的阈值(见adaptiveMethod参数)。
该函数可以就地处理图像。

3.2.1.1举例演示

#自适应阈值处理
img = cv2.imread('dog.jpg')
img_gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
img = cv2.medianBlur(img_gray,5)     #中值滤波平滑处理
ret,th1 = cv2.threshold(img,127,255,cv2.THRESH_BINARY)      #全局图像阈值处理
th2 = cv2.adaptiveThreshold(img,255,cv2.ADAPTIVE_THRESH_MEAN_C,cv2.THRESH_BINARY,11,2)       #自适应图像阈值处理
th3 = cv2.adaptiveThreshold(img,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C,cv2.THRESH_BINARY,11,2)

titles = ['Original Image', 'Global Thresholding (v = 127)',
            'Adaptive Mean Thresholding', 'Adaptive Gaussian Thresholding']
images = [img, th1, th2, th3]

plt.figure()
for i in range(4):
    plt.subplot(2,2,i+1),plt.imshow(images[i],'gray')
    plt.title(titles[i])
    plt.xticks([]),plt.yticks([])
plt.show()

运行结果：
在这里插入图片描述
通过对比可以看出，图2进行的全局统一阈值化处理的效果和图3、图4自适应阈值化处理的效果有很大的不同。

3.3 大津二值化算法 ( Otsu’s binarization )

在第一节中，函数返回值还有第二个参数retVal。当我们使用Otsu的二值化时，就会用到它。那么它是什么呢?

在全局阈值中，我们使用任意值作为阈值，那么，我们如何知道我们选择的值是好是坏呢?答案是，试错法。但是考虑一个双峰图像(简单地说，双峰图像是直方图有两个峰值的图像)。对于这个图像，我们可以在这些峰值中间取一个值作为阈值，这就是大津二值化所做的。因此，简单地说，它从图像直方图的双峰图像自动计算一个阈值。(对于非双峰的图像，二值化是不准确的)

为此，使用我们的cv2.threshold()函数，但传递一个额外的标志cv2.THRESH_OTSU。对于阈值，只需传递0即可。然后，该算法会找到最优阈值，并作为第二个输出retVal返回给您。如果不使用Otsu阈值，则retVal与您使用的阈值相同。

3.3.1Otsu算法原理

由于我们使用的是双峰图像，Otsu的算法试图找到一个阈值(t)，使由关系给出的加权类内方差最小: 在这里插入图片描述
其中：

它会找到一个t值位于两个峰值之间这样两类的方差都是最小的。

3.3.2举例演示

看看下面的例子。输入图像是有噪声的图像。在第一个例子中，我为127应用了全局阈值。在第二种情况中，我直接应用了Otsu的阈值。在第三种情况下，我用5x5高斯核滤除图像中的噪声，然后应用Otsu阈值。查看噪声滤波如何改善结果。

#大津二值化算法 ( Otsu's binarization ) 
img = cv2.imread('dog.jpg')
img = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)      #转化为灰度图

# global thresholding
ret1,th1 = cv2.threshold(img,127,255,cv2.THRESH_BINARY)       #全局图像阈值化处理
# Otsu's thresholding
ret2,th2 = cv2.threshold(img,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)  #Otsu算法阈值化
# Otsu's thresholding after Gaussian filtering
blur = cv2.GaussianBlur(img,(5,5),0)		#高斯滤波
ret3,th3 = cv2.threshold(blur,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU) #高斯滤波之后，Otsu算法阈值化
# plot all the images and their histograms
images = [img, 0, th1,
          img, 0, th2,
          blur, 0, th3]
titles = ['Original Noisy Image','Histogram','Global Thresholding (v=127)',
          'Original Noisy Image','Histogram',"Otsu's Thresholding",
          'Gaussian filtered Image','Histogram',"Otsu's Thresholding"]
for i in range(3):
    plt.subplot(3,3,i*3+1),plt.imshow(images[i*3],'gray')
    plt.title(titles[i*3]), plt.xticks([]), plt.yticks([])
    plt.subplot(3,3,i*3+2),plt.hist(images[i*3].ravel(),256)
    plt.title(titles[i*3+1]), plt.xticks([]), plt.yticks([])
    plt.subplot(3,3,i*3+3),plt.imshow(images[i*3+2],'gray')
    plt.title(titles[i*3+2]), plt.xticks([]), plt.yticks([])
plt.show()

运行结果：
在这里插入图片描述

主要参考于OpenCV官方网站：http://www.opencv.org.cn/

目前博主已更新OpenCV平滑处理函数、形态学操作函数的详细介绍，链接如下：
【OpenCV-图像处理】图像平滑处理函数

【OpenCV-图像处理】形态学变换函数

<后续还会继续翻译和整理【OpenCV-图像处理】相关内容，如果需要，可持续关注我哦~>

<翻译和整理不易，留个赞或评论支持一下我吧^^>

如有疑问，欢迎批评指正^^

路遥_.

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
【OpenCV-图像处理】图像阈值处理——OpenCV官方教程翻译（全网最详细）

OpenCV的imgproc 模块：图像阈值处理 cv2.threshold() 、cv2.adaptiveThreshold()。在本教程中，您将学习全局阈值化，自适应阈值化，Otsu阈值化等。
复制链接

扫一扫