阈值分割：最大类间方差法

最新推荐文章于 2024-04-10 08:12:55 发布

朝暮1122

最新推荐文章于 2024-04-10 08:12:55 发布

阅读量4.4k

点赞数 2

文章标签：人工智能计算机视觉图像处理

本文链接：https://blog.csdn.net/qq_44803884/article/details/118528347

版权

图像处理与计算机视觉专栏收录该内容

1 篇文章 0 订阅

订阅专栏

阈值分割：最大类间方差法

一、简介

最大类间方差法，又称为大津阈值法，或OTSU算法。是由日本学者大津在 $1979$ 年提出的一种非参数的、无监督的自动选择阈值的图像分割方法。

二、算法描述

2.1 公式推导

对于给定的一幅具有 $L$ 个灰度级（ $[0,1,2,\cdots,L-1]$ ）的灰度图像，有以下描述：

使用 $n_{i}$ 表示处于灰度级 $i$ 的像素块的数目；
使用 $n_0 + n_1 + \cdots + n_{L-1}$ 表示该图像所有像素块的数目总和。

对该图像的灰度级直方图进行 标准化处理 可以得到一个概率分布：
$p_i = \frac{n_i}{N}，\quad p_i \ge 0,\quad \sum_{i=0}^{L-1}{p_i} =1 \tag{1}$

以灰度级 $k$ 为阈值，可将该图像中的像素块二分为两大类 $C_{0}$ 和 $C_{1}$ （背景和前景，反之亦然），其中：

$C_0$ 表示灰度级在范围 $[0,1,\cdots,k-1]$ 的像素集合；
$C_1$ 表示灰度级在范围 $[k,k+1,\cdots,L-1]$ 的像素集合。

记 $w_0$ 与 $w_1$ 分别为类 $C_0$ 和类 $C_1$ 发生的概率，则显然有：
$\sum_{i = 1}^{L-1}{p_i} = w_0 + w_1 = 1 \tag{2}$

其中， $w_0$ 与 $w_1$ 可表示为 零阶矩 的形式：
$w_0 = Pr(C_0) = \sum_{i = 0}^{k-1}{p_{i}} = w(k) \tag{3}$

$w_1 = Pr(C_1) = \sum_{i = k}^{L-1}{p_{i}} = 1 - w(k) \tag{4}$

类 $C_0$ 与类 $C_1$ 发生的期望（或均值）可表示为 一阶矩 的形式：
$\mu_0 = \sum_{i=0}^{k-1}{iPr(i|C_0)} = \sum_{i=0}^{k-1}{i \frac{p_i}{w_0}} = \frac{1}{w_0}\sum_{i = 0}^{k-1}{ip_i} = \frac{\mu(k)}{w(k)} \tag{5}$

$\mu_1 = \sum_{i=k}^{L-1}{iPr(i|C_1)} = \sum_{i=k}^{L-1}{i \frac{p_i}{w_1}} = \frac{1}{w_1}\sum_{i = k}^{L-1}{ip_i}=\frac{\mu_{T} - \mu(k)}{1 - w(k)} \tag{5}$

其中：
$\mu(k) = \sum_{i = 0}^{k-1}{ip_i},\quad\mu_{T} = \sum_{i = 0}^{L-1}{ip_i} \tag{6}$

显然，有：
$\mu_0 w_0 + \mu_1 w_1 =\mu_{T} \tag{7}$

类 $C_0$ 与类 $C_1$ 发生的方差可以表示为 二阶矩 的形式：
$\sigma_{0}^{2} = \sum_{i = 0}^{k-1}{(i - \mu_{0})^{2}Pr(i|C_0)} = \sum_{i = 0}^{k-1}{(i - \mu_0)^2\frac{p_i}{w_0}} \tag{8}$

$\sigma_1^{2} = \sum_{i = k}^{L-1}{(i - \mu_1)^{2}Pr(i|C_1)} = \sum_{i = k}^{L-1}{(i - \mu_1)^{2}\frac{p_i}{w_1}} \tag{9}$

为了评估所选阈值 $k$ 的优良（goodness），引入以下三种判别标准度量：
$\lambda = \frac{\sigma_{B}^{2}}{\sigma_{W}^{2}},\quad \kappa = \frac{\sigma_{T}^{2}}{\sigma_{W}^{2}},\quad \eta = \frac{\sigma_{B}^{2]}}{\sigma_{T}^{2}} \tag{10}$

其中：
（1）类内方差（within-class variance，简记为 $\sigma_{with}^{2}$ 或 $\sigma_{W}^{2}$ ）满足：
$\sigma_{W}^{2} = w_0 \sigma_{0}^{2} + w_1 \sigma_{1}^{2} \tag{11}$

（2）类间方差（between-class variance，简记为 $\sigma_{Between}^{2}$ 或 $\sigma_{B}^{2}$ ）满足：
$\sigma_{B}^{2} = w_{0}(\mu_{0} - \mu_{T})^{2} + w_1(\mu_{1} - \mu_{T})^{2} = w_{0}w_{1}(\mu_{1} - \mu_{0})^{2} \tag{12}$

（3）全局方差（total variance，简记为 $\sigma_{Total}^{2}$ 或 $\sigma_{T}^{2}$ ）满足：
$\sigma_{T}^{2} = \sum_{i = 0}^{L-1}{(i - \mu_{T})^{2}p_{i}} \tag{13}$

合适的阈值会将图像分割为两类。反过来就是说，能在灰度水平上实现最佳分离的阈值将是最合适的阈值。

因此，利用引入的判别标准度量，可以将问题转化为一个优化问题：寻找一个合适的阈值 $k$ 最大化某一个判别标准度量函数（ $\lambda$ ， $\kappa$ 以及 $\eta$ 中的某一个）。

那么选择哪一个判别标准度量最为合适呢？

实际上，最大化判别标准 $\lambda$ ， $\kappa$ 以及 $\eta$ 是相互等价的。
因为，以 $\lambda$ 为单位可以分别表示 $\kappa$ 以及 $\eta$ ：
$\kappa = \lambda + 1,\quad \eta = \frac{\lambda}{\lambda + 1} \tag{14}$

并且以下基本关系式始终成立：
$\sigma_{W}^{2} + \sigma_{B}^{2} = \sigma_{T}^{2} \tag{15}$

也就是说，当三个判别标准度量中的任意一个达到最大时，另外两个都会达到最大值。其中：

$\sigma_{W}^{2}$ 和 $\sigma_{B}^{2}$ 均是阈值 $k$ 的函数；
$\sigma_{T}^{2}$ 与阈值 $k$ 无关；
$\sigma_{W}$ 需要计算二阶矩，而 $\sigma_{B}^{2}$ 仅仅需要计算一阶矩。

所以， $\eta$ 是关于阈值 $k$ 的最简单的判别标准度量。

因此，使用 $\eta$ 作为评估阈值 $k$ 优良的判别标准。

现在，求解最大化判别标准 $\eta$ 时的最佳阈值 $k^{*}$ 。分析 $\eta = \frac{\sigma_{B}^{2}}{\sigma_{T}^{2}}$ 可知，最大化 $\eta$ 即最大化 $\sigma_{B}^{2}$ 。即：
$\eta(k) = \frac{\sigma_{B}^{2}(k)}{\sigma_{T}^{2}} \tag{16}$

并且有：
$\sigma_{B}^{2}(k) = \frac{\left[ \mu_{T} w(k) - \mu(k)\right]^{2}}{w(k)\left[1 - w(k)\right]} \tag{17}$

最优阈值 $k^{*}$ 可以表示为：
$k^{*} = \arg \underset{1 \le k \le L-1}{\max}{\sigma_{B}^{2}{(k)}} \tag{18}$

其中，阈值 $k$ 的搜索范围可以表示为：
$S^{*} = \{k~|~ w_0 w_1 = w(k)\left[1 - w(k)\right] > 0, ~ o r~ 0<w(k)<1\} \tag{19}$
该范围称为灰度直方图的有效范围。

从公式（12）中
$\sigma_{B}^{2} = w_{0}(\mu_{0} - \mu_{T})^{2} + w_1(\mu_{1} - \mu_{T})^{2} = w_{0}w_{1}(\mu_{1} - \mu_{0})^{2}$
可以看出：

当选定的阈值 $\in S - S^{*} = \{k ~|~w(k) = 0~or~1\}$ 时，判别标准度量 $\eta$ 取最小值 $0$ 。
当选定的阈值 $\in S^{*}$ 时，判别标准度量 $\eta$ 取一个正的且有界的值。

因此，显而易见，判别标准的最大值始终存在。

2.2 算法分析

对于选定的阈值 $k^{*}$ ：
$w_{0}^{*} = Pr(C_{0}^{*}) = \sum_{i = 0}^{k^{*} - 1}{p_i} = w(k^{*}) \tag{20}$

$w_{1}^{*} = Pr(C_1^{*}) = \sum_{i = k^{*}}^{L-1}{p_{i}} = 1 - w(k^{*}) \tag{21}$

分别表示了灰度图像按照阈值 $k^{*}$ 所划分的两类的发生概率。

类 $C_{0}^{*}$ 与类 $C_{1}^{*}$ 发生的期望分别为：
$\mu_{0}^{*} = \sum_{i = 0}^{k^{*}-1}{iPr(i|C_{0}^{*})} = \sum_{i = 0}^{k^{*} - 1}{i \frac{pi}{w_{0}^{*}}} = \frac{\mu(k^{*})}{w(k^{*})} \tag{22}$
$\mu_{1}^{*} = \sum_{i = k^{*}}^{L-1}{iPr(i|C_{1}^{*})} = \sum_{i = k^{*}}^{L-1}{i\frac{p_i}{w_1^{*}}} = \frac{\mu_{T} - \mu(k^{*})}{1 - w(k^{*})} \tag{23}$

将判别标准 $\eta$ 的最大值 $\eta(k^{*})$ 简记为 $\eta^{*}$ ，可以用作评估灰度图像中类的可分性的标准。这是一个重要的度量，它在灰度尺度的放射变化（也就是说，对于任意的位移和扩张）下是不变的。

2.3 算法扩展

实际上，利用判别准则，可以直接将OTSU算法推广至 多阈值 的情形。例如：
在三阈值的情形下，可以选择两个阈值 $\le k_1 k_2 \le 1$ 将原始灰度图像分化为三类。此时标准度量 $\eta$ 存在两个参数 $k_1$ 与 $k_2$ ，最佳阈值 $k_1^{*},k_{2}^{*}$ 可通过最大化 $\eta$ ：
$(k_{1}^{*},k_{2}^{*})=\arg \underset{1 \le k_{1} \le k_{2} \le L-1}{\max}{\sigma_{B}^{2}(k_{1},k_{2})} \tag{24}$

进行求解。

参考文献

[1] Ostu N , Nobuyuki O , Otsu N . A thresholding selection method from gray level histogram. 1979.

朝暮1122

关注

2
点赞
踩
26

收藏

觉得还不错? 一键收藏
0
评论
阈值分割：最大类间方差法

阈值分割：最大类间方差法一、简介最大类间方差法，又称为大津阈值法，或OTSU算法。是由日本学者大津在197919791979年提出的一种非参数的、无监督的自动选择阈值的图像分割方法。二、算法描述2.1 公式推导对于给定的一幅具有 LLL 个灰度级（[0,1,2,⋯ ,L−1][0,1,2,\cdots,L-1][0,1,2,⋯,L−1]）的灰度图像，有以下描述：使用 nin_{i}ni 表示处于灰度级 iii 的像素块的数目；使用 N=n0+n1+⋯+nL−1N = n_0 + n_1 +
复制链接

扫一扫