【OpenCV-图像处理】图像阈值处理——OpenCV官方教程翻译(全网最详细)

一、目标

  • 在本教程中,您将学习全局阈值化,自适应阈值化,Otsu阈值化等。
  • 您将学习这些两个函数: cv2.threshold(), cv2.adaptiveThreshold()。

二、基本理论

什么是阈值?

  • 它是一种最简单的图像分割的方法。

  • 应用举例:从一副图像中利用阈值分割出我们需要的物体部分(当然这里的物体可以是一部分或者整体)。这样的图像分割方法是基于图像中物体与背景之间的灰度差异,而且此分割属于像素级的分割。

  • 为了从一副图像中提取出我们需要的部分,应该用图像中的每一个像素点的灰度值与选取的阈值进行比较,并作出相应的判断。(注意:阈值的选取依赖于具体的问题。即:物体在不同的图像中有可能会有不同的灰度值。

  • 一旦找到了需要分割的物体的像素点,我们可以对这些像素点设定一些特定的值来表示。(例如:可以将该物体的像素点的灰度值设定为:‘0’(黑色),其他的像素点的灰度值为:‘255’(白色);当然像素点的灰度值可以任意,但最好设定的两种颜色对比度较强,方便观察结果)。

2.1 阈值化的类型

  • OpenCV中提供了阈值化函数: cv2.threshold()cv2.adaptiveThreshold()

  • 这个函数有5种阈值化类型,在接下来的章节中将会具体介绍。

  • 为了解释阈值分割的过程,我们来看一个简单有关像素灰度的图片,该图如下。该图中的蓝色水平线代表着具体的一个阈值。
    在这里插入图片描述

2.1.1 二进制阈值化 cv2.THRESH_BINARY

  • 该阈值化类型如下式所示::在这里插入图片描述
  • 解释:在运用该阈值类型的时候,先要选定一个特定的阈值量,比如:125,这样,新的阈值产生规则可以解释为大于125的像素点的灰度值设定为最大值(如8位灰度值最大为255),灰度值小于125的像素点的灰度值设定为0。
    在这里插入图片描述

2.1.2 反二进制阈值化 cv2.THRESH_BINARY_INV

  • 该阈值类型如下式所示:在这里插入图片描述
  • 解释:该阈值化与二进制阈值化相似,先选定一个特定的灰度值作为阈值,不过最后的设定值相反。(在8位灰度图中,例如大于阈值的设定为0,而小于该阈值的设定为255)
    在这里插入图片描述

2.1.3 截断阈值化 cv2.THRESH_TRUNC

  • 该阈值化类型如下式所示:在这里插入图片描述
  • 解释:同样首先需要选定一个阈值,图像中大于该阈值的像素点被设定为该阈值,小于该阈值的保持不变。(例如:阈值选取为125,那小于125的阈值不改变,大于125的灰度值(230)的像素点就设定为该阈值)。
    在这里插入图片描述

2.1.4 阈值化为0 cv2.THRESH_TOZERO

  • 该阈值类型如下式所示:在这里插入图片描述
  • 解释:先选定一个阈值,然后对图像做如下处理:1 像素点的灰度值大于该阈值的不进行任何改变;2 像素点的灰度值小于该阈值的,其灰度值全部变为0。
    在这里插入图片描述

2.1.5反阈值化为0 cv2.THRESH_TOZERO_INV

  • 该阈值类型如下式所示:

在这里插入图片描述

  • 解释:原理类似于0阈值,但是在对图像做处理的时候相反,即:像素点的灰度值小于该阈值的不进行任何改变,而大于该阈值的部分,其灰度值全部变为0。
    在这里插入图片描述

三、图像阈值化处理

3.1 全局阈值化处理函数cv2.threshold()

retval, dst = cv2.threshold	(	InputArray 	src,
								double 	thresh,
								double 	maxval,
								int 	type 
)	
参数说明
src输入图,输入数组(多通道,8位或32位浮点数),一般为灰度图。
dst输出图,与src具有相同大小和类型以及相同通道数量的输出数组。
thresh阈值,与THRESH_BINARY和THRESH_BINARY_INV阈值类型一起使用的最大值
maxval当像素值超过了阈值(或者小于阈值,根据type来决定),所赋予的值
type二值化操作的类型,阈值类型(参见ThresholdTypes)。

ThresholdTypes包含以下5种类型: cv2.THRESH_BINARYcv2.THRESH_BINARY_INVcv2.THRESH_TRUNCcv2.THRESH_TOZEROcv2.THRESH_TOZERO_INV

ThresholdTypes参数说明
cv2.THRESH_BINARY超过阈值部分取maxval(最大值),否则取0
cv2.THRESH_BINARY_INVTHRESH_BINARY的反转
cv2.THRESH_TRUNC大于阈值部分设为阈值,否则不变
cv2.THRESH_TOZERO大于阈值部分不改变,否则设为0
cv2.THRESH_TOZERO_INVTHRESH_TOZERO的反转
cv2.THRESH_MASK
cv2.THRESH_OTSU标志,使用Otsu算法选择最优阈值
cv2.THRESH_TRIANGLE标志,使用三角形算法选择最优阈值

对每个数组元素应用一个固定级别的阈值。

该函数对多通道阵列应用固定级别阈值。该函数通常用于从灰度图像中获得双级(二值)图像(compare也可用于此目的)或去除噪声,即过滤出值太小或太大的像素。该函数支持几种类型的阈值设置。它们由类型参数决定。

另外,特殊值THRESH_OTSUTHRESH_TRIANGLE可以与上述值中的一个结合使用。在这些情况下,函数使用Otsu的或Triangle算法确定最佳阈值

注意:目前,Otsu和Triangle方法仅适用于8位的单通道图像。

3.1.1 举例演示

import cv2 
import numpy as np
from matplotlib import pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']        #文字字体为黑体

#彩色图像阈值化
img = cv2.imread('dog.jpg')
b,g,r = cv2.split(img)
img = cv2.merge((r,g,b))	#BGR转RGB

ret, thresh1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
ret, thresh2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)
ret, thresh3 = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)
ret, thresh4 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)
ret, thresh5 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)

titles = ['Original Image', 'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV']
images = [img, thresh1, thresh2, thresh3, thresh4, thresh5]

plt.figure()
for i in range(6):
    plt.subplot(2, 3, i + 1), plt.imshow(images[i], 'gray')
    plt.suptitle('彩色图像阈值化')
    plt.title(titles[i])
    plt.xticks([]), plt.yticks([])
plt.show()

运行结果:在这里插入图片描述
注意:通过实践,cv2.threshold()是可以处理BGR彩色图像的,而下文介绍的cv2.adaptiveThreshold()不能处理彩色图像。但是在我的专业领域下,可能对彩色图像阈值化处理并没有多大意义,所以还是统一使用灰度图最为输入图像吧。

#灰度图像阈值化
img = cv2.imread('dog.jpg')
img_gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

ret, thresh1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY)
ret, thresh2 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY_INV)
ret, thresh3 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TRUNC)
ret, thresh4 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TOZERO)
ret, thresh5 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TOZERO_INV)

titles = ['Original Image', 'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV']
images = [img_gray, thresh1, thresh2, thresh3, thresh4, thresh5]

plt.figure()
for i in range(6):
    plt.subplot(2, 3, i + 1), plt.imshow(images[i], 'gray')
    plt.suptitle('灰度图像阈值化')
    plt.title(titles[i])
    plt.xticks([]), plt.yticks([])
plt.show()

运行结果:
在这里插入图片描述

3.2自适应阈值处理

在上一节中,我们使用全局值作为阈值。但它可能不是在所有的条件下,图像有不同的照明条件在不同的区域。在这种情况下,我们使用自适应阈值。在这种情况下,算法计算的阈值的小区域的图像。因此,我们对同一幅图像的不同区域得到了不同的阈值,对不同光照的图像得到了更好的结果。

它有三个“特殊的”输入参数,只有一个输出参数。

自适应方法-它决定如何阈值的计算。

  • ADAPTIVE_THRESH_MEAN_C:阈值是相邻区域的均值。
  • ADAPTIVE_THRESH_GAUSSIAN_C:阈值是权重为高斯窗的邻域值的加权和。

3.2.1自适应阈值处理函数cv2.adaptiveThreshold()

dst = cv2.adaptiveThreshold	(	InputArray 	src,
								double 	maxValue,
								int 	adaptiveMethod,
								int 	thresholdType,
								int 	blockSize,
								double 	C 
)	
参数说明
src输入图,8位单通道图像
dst与src相同大小和类型的目标图像
maxValue赋给满足条件的像素的非零值
adaptiveMethod使用自适应阈值算法,请参见AdaptiveThresholdTypes。使用BORDER_REPLICATE, BORDER_ISOLATED来处理边界
thresholdType阈值类型必须为THRESH_BINARY或THRESH_BINARY_INV,请参见ThresholdTypes
blockSize用于计算像素阈值的像素邻域大小:3、5、7,等等
C常数减去平均值或加权平均值(详见下文)。通常,它是正的,但也可以是零或负的

AdaptiveThresholdTypes(自适应阈值算法参数)

AdaptiveThresholdTypes参数说明
cv2.ADAPTIVE_THRESH_MEAN_C阈值T(x,y)是(x,y) - C的blockSize×blockSize邻域的均值
cv2.ADAPTIVE_THRESH_GAUSSIAN_C阈值T(x,y)是(x,y) - C的blockSize×blockSize邻域的加权和(与高斯窗口相互关联)。指定的块大小使用默认的sigma(标准偏差)。见getGaussianKernel

对数组应用自适应阈值。
该函数将灰度图像转换为二值图像,其公式如下:

  • THRESH_BINARY:
    在这里插入图片描述
  • THRESH_BINARY_INV:
    在这里插入图片描述
    其中T(x,y)是为每个像素单独计算的阈值(见adaptiveMethod参数)。
    该函数可以就地处理图像。

3.2.1.1举例演示

#自适应阈值处理
img = cv2.imread('dog.jpg')
img_gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
img = cv2.medianBlur(img_gray,5)     #中值滤波平滑处理
ret,th1 = cv2.threshold(img,127,255,cv2.THRESH_BINARY)      #全局图像阈值处理
th2 = cv2.adaptiveThreshold(img,255,cv2.ADAPTIVE_THRESH_MEAN_C,cv2.THRESH_BINARY,11,2)       #自适应图像阈值处理
th3 = cv2.adaptiveThreshold(img,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C,cv2.THRESH_BINARY,11,2)

titles = ['Original Image', 'Global Thresholding (v = 127)',
            'Adaptive Mean Thresholding', 'Adaptive Gaussian Thresholding']
images = [img, th1, th2, th3]

plt.figure()
for i in range(4):
    plt.subplot(2,2,i+1),plt.imshow(images[i],'gray')
    plt.title(titles[i])
    plt.xticks([]),plt.yticks([])
plt.show()

运行结果:
在这里插入图片描述
通过对比可以看出,图2进行的全局统一阈值化处理的效果和图3、图4自适应阈值化处理的效果有很大的不同。

3.3 大津二值化算法 ( Otsu’s binarization )

在第一节中,函数返回值还有第二个参数retVal。当我们使用Otsu的二值化时,就会用到它。那么它是什么呢?

在全局阈值中,我们使用任意值作为阈值,那么,我们如何知道我们选择的值是好是坏呢?答案是,试错法。但是考虑一个双峰图像(简单地说,双峰图像是直方图有两个峰值的图像)。对于这个图像,我们可以在这些峰值中间取一个值作为阈值,这就是大津二值化所做的。因此,简单地说,它从图像直方图的双峰图像自动计算一个阈值。(对于非双峰的图像,二值化是不准确的)

为此,使用我们的cv2.threshold()函数,但传递一个额外的标志cv2.THRESH_OTSU。对于阈值,只需传递0即可。然后,该算法会找到最优阈值,并作为第二个输出retVal返回给您。如果不使用Otsu阈值,则retVal与您使用的阈值相同。

3.3.1Otsu算法原理

由于我们使用的是双峰图像,Otsu的算法试图找到一个阈值(t),使由关系给出的加权类内方差最小:在这里插入图片描述
其中:
在这里插入图片描述
它会找到一个t值位于两个峰值之间这样两类的方差都是最小的。

3.3.2举例演示

看看下面的例子。输入图像是有噪声的图像。在第一个例子中,我为127应用了全局阈值。在第二种情况中,我直接应用了Otsu的阈值。在第三种情况下,我用5x5高斯核滤除图像中的噪声,然后应用Otsu阈值。查看噪声滤波如何改善结果。

#大津二值化算法 ( Otsu's binarization ) 
img = cv2.imread('dog.jpg')
img = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)      #转化为灰度图

# global thresholding
ret1,th1 = cv2.threshold(img,127,255,cv2.THRESH_BINARY)       #全局图像阈值化处理
# Otsu's thresholding
ret2,th2 = cv2.threshold(img,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)  #Otsu算法阈值化
# Otsu's thresholding after Gaussian filtering
blur = cv2.GaussianBlur(img,(5,5),0)		#高斯滤波
ret3,th3 = cv2.threshold(blur,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU) #高斯滤波之后,Otsu算法阈值化
# plot all the images and their histograms
images = [img, 0, th1,
          img, 0, th2,
          blur, 0, th3]
titles = ['Original Noisy Image','Histogram','Global Thresholding (v=127)',
          'Original Noisy Image','Histogram',"Otsu's Thresholding",
          'Gaussian filtered Image','Histogram',"Otsu's Thresholding"]
for i in range(3):
    plt.subplot(3,3,i*3+1),plt.imshow(images[i*3],'gray')
    plt.title(titles[i*3]), plt.xticks([]), plt.yticks([])
    plt.subplot(3,3,i*3+2),plt.hist(images[i*3].ravel(),256)
    plt.title(titles[i*3+1]), plt.xticks([]), plt.yticks([])
    plt.subplot(3,3,i*3+3),plt.imshow(images[i*3+2],'gray')
    plt.title(titles[i*3+2]), plt.xticks([]), plt.yticks([])
plt.show()

运行结果:
在这里插入图片描述

主要参考于OpenCV官方网站:http://www.opencv.org.cn/

目前博主已更新OpenCV平滑处理函数、形态学操作函数的详细介绍,链接如下:
【OpenCV-图像处理】图像平滑处理函数

【OpenCV-图像处理】形态学变换函数

<后续还会继续翻译和整理【OpenCV-图像处理】相关内容,如果需要,可持续关注我哦~>

<翻译和整理不易,留个赞或评论支持一下我吧^^>

如有疑问,欢迎批评指正^^

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

路遥_.

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值