大津法（OTSU 最大类间方差法）详细数学推导（公式繁杂，欢迎讨论）

最新推荐文章于 2025-04-01 16:52:21 发布

亚里仕多德

最新推荐文章于 2025-04-01 16:52:21 发布

阅读量7.8k

点赞数 31

分类专栏：随笔文章标签：算法机器学习图像识别

本文链接：https://blog.csdn.net/m0_38024332/article/details/104226806

版权

15 篇文章

订阅专栏

本文深入探讨了大津算法中的类内方差与类间方差概念，通过详细的数学推导，解释了如何通过最大化类间方差来实现最优阈值选择，同时揭示了类内方差最小化的原理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

大家新年快乐哇, 武汉加油，我的家乡温州也加油，中国加油！向前线人员致敬！

最近在家里做迁移学习，受限于笔记本的限制，深度方向做不了，开始看师兄的论文，发现论文里提到最大方差法，但是没有具体说明出处，去查找相应的出处，也就看到了大津算法，但很奇怪的是，好多人都是很简略地说了思想，到底怎么出来的，还是没明白，因此自己找呗~

将进行一个阈值即两类的推导，让思想动起来！

大津算法提出了两个方差(若有人知道更早的出处欢迎留言指出)。
1.within-class variance 类内方差
2.between-class variance 类间方差

提前指出结论

1.大津法的目标就是最大化类间方差
2.实现最大化类间方差同时就实现了类内方差最小化，因为二者的平方和为定值
3.最优阈值点一定存在

具体程序就麻烦小伙伴自己找找啦。

~~ 进入正题 ~~

现在有一张灰度图含有背景图像和目标图像( $C_0, C_1$ )，我们要找到一个阈值将像素值分为两块使两者最好的区分。
来源于网络

图来源于网络，右图类间差异大，区分明显。所以最大化类间差异

现在再来看看公式推导

将图片的像素值分为 [1, 2, …, L] 个水平，用 $n_i$ 表示各个水平像素值的像素个数，那么很容易得到总像素个数为

$N = n_1 + n_2 + ... + n_L$

我们利用像素值对应个数与总数的商作为某个像素值出现的频率，定义 $p_i$

$p_i = n_i / N_i, p_i \ge0, \sum_{i=1}^L p_i=1$

定义两个量 $w_0, w_1$ 为 $C_0, C_1$ 的局部频率之和，并且得到二者的关系

$w_0 = Pr(C_0) = \sum_{i=1}^k p_i = w(k)$

$w_1 = Pr(C_1) = \sum_{i=k+1}^L p_i = 1-w(k)$

由此我们得到总的数学期望和 $C_0, C_1$ 各自的数学期望并指出三者的关系，式中 $i$ 代表像素值，除于各自频率的和用于进行归一。

$u_T = u(L) = \sum_{i=1}^L i*p_i$

$u_0 = \sum_{i=1}^k i*Pr(i|C_0)=\sum_{i=1}^k i*p_i/w_0 = \dfrac{u(k)}{w(k)}$

$u_1 = \sum_{i=k+1}^L i*Pr(i|C_1)=\sum_{i=k+1}^L i*p_i/w_1 = \dfrac{u_T - u(k)}{1-w(k)}$

并指出以上公式之间的关系：

$w_0u_0+w_1u_1 = u_T \space \space \space \space \space \space \space w_0+w_1 = 1$

除了数学期望，计算各自局部方差和总方差

$\sigma_T^2=\sum_{i=1}^L (i-u_T)^2p_i$

$\sigma_0^2=\sum_{i=1}^k (i-u_0)^2Pr(i|C_0)=\sum_{i=1}^k (i-u_0)^2p_i/w_0$

$\sigma_0^1=\sum_{i=k+1}^L (i-u_1)^2Pr(i|C_1)=\sum_{i=k+1}^L (i-u_1)^2p_i/w_0$

基础打完，为了大家翻遍查阅，列一个表格方便查阅