Otsu算法原理与python实现

最新推荐文章于 2024-07-27 09:05:13 发布

normol

最新推荐文章于 2024-07-27 09:05:13 发布

阅读量4.8k

点赞数 6

分类专栏：数字图像处理文章标签：算法 python 图像处理

本文链接：https://blog.csdn.net/normol/article/details/106011456

版权

数字图像处理专栏收录该内容

7 篇文章 2 订阅

订阅专栏

[注：下面公式所涉及的是带权重的均值与方差，一开始我并不明白为什么要这样做，还去查了关于带权重与不带权重计算均值或方差的区别，后面发现，应该是因为该算法的计算是基于概率分布，而概率分布意味着这是一个可以根据概率，产生无数样本的population，而非sample，因此对概率分布求均值就相当于求期望，方差也同理，需要带上概率]

原理

一幅图片的所有像素有 $L$ 个灰度级， $[1,2,\cdots,L]$
处于灰度级 $i$ 的像素数量表示为 $n_i$ ，因此像素的总数为 $N=n_1+n_2+\cdots+n_L$ 。后续为了简化讨论，将灰度直方图归一化，因而就能被视为一个概率分布：
$p_i=\frac{n_i}{N},\quad p_i\ge,\sum_{i=1}^{L}p_i=1 \qquad(1)$
现在，将所有像素以灰度级 $k$ 为阈值，划分为两类 $C_0$ 和 $C_1$ ， $C_0$ 代表处于灰度级 $[1,\cdots,k]$ 的像素， $C_1$ 代表处于灰度级 $[k+1,\cdots,L]$ 的像素。
某一类别出现的概率为：
$\omega_0=Pr(C_0)=\sum_{i=1}^{k}p_i=\omega(k) \qquad(2)$
$\omega_1=Pr(C_1)=\sum_{i=k+1}^{L}p_i=1-\omega(k) \qquad(3)$
某一类别的平均灰度级为（注意是条件概率）：
$\mu_0=\sum_{i=1}^{k}iPr(i|C_0)=\sum_{i=1}^{k}\frac{ip_i}{\omega_0}=\frac{\mu(k)}{\omega(k)} \qquad(4)$
其中 $\mu(k)=\sum_{i=1}^{k}ip_i\qquad(5)$
$\mu(k)$ 可以看成灰度直方图到k的一阶矩，同理，公式(2)中的 $\omega(k)$ 可以看成灰度直方图到k的零阶矩。
$\mu_1=\sum_{i=k+1}^{L}iPr(i|C_1)=\sum_{i=k+1}^{L}\frac{ip_i}{\omega_1}=\frac{\mu_T-\mu(k)}{1-\omega(k)} \qquad(6)$
其中 $\mu_T=\mu(L)=\sum_{i=1}^{L}ip_i\qquad(7)$
$\mu_T$ 是原图像的整体平均灰度级。根据上述公式，对于任意的k，我们有：
$\omega_0\mu_0+\omega_1\mu_1=\mu_T,\quad\omega_0+\omega_1=1\qquad(8)$
(ps:这可以理解为全概率公式，也是公式(4),(6)用条件概率的原因，比如考虑人患艾滋病的概率 $P (S)$ ，现在你可以把人群分的细一些，比如（男性 $M$ ，女性 $W$ ），它们都有自己的发生概率。当考虑一个完全的分类结果时候，你就得到了全概率公式。在这里你会得到：患病概率 = 男性患病概率 * 男性人口比例 + 女性患病概率 * 女性人口比例。用概率公式写出来就是 $P (S) = P (S ∣ M) P (M) + P (S ∣ W) P (W)$ )
某一类的灰度级方差为：
$\sigma_0^{2}=\sum_{i=1}^{k}(i-\mu_0)^2Pr(i|C_0)=\sum_{i=1}^{k}(i-\mu_0)^2\frac{p_i}{\omega_0}\qquad(9)$
$\sigma_1^{2}=\sum_{i=k+1}^{L}(i-\mu_1)^2Pr(i|C_1)=\sum_{i=k+1}^{L}(i-\mu_1)^2\frac{p_i}{\omega_1}\qquad(10)$
接下来，为了衡量阈值k选取的好坏，我们首先引进线性判别式分析（Linear Discriminant Analysis, LDA）里的思想，希望选定的阈值能使不同的类之间相差越大越好，相同的类则相差越小越好(即最大化 $\lambda$ )，Otsu论文中的公式如下(但是在LDA里，我只看到了 $\lambda$ ，不知道 $\kappa$ 和 $\eta$ 是本文提出来的还是怎样)：
$\lambda=\frac{\sigma_B^{2}}{\sigma_W^{2}},\quad \kappa=\frac{\sigma_T^{2}}{\sigma_W^{2}},\quad \eta=\frac{\sigma_B^{2}}{\sigma_T^{2}} \qquad(11)$
其中 $\sigma_W^{2}$ 、 $\sigma_B^{2}$ 、 $\sigma_T^{2}$ 分别代表类内(within-class)方差，类间(between-class)方差与所有灰度级的总(total levels)方差。计算方法如下：
$\sigma_W^{2}=\omega_0\sigma_0^{2}+\omega_1\sigma_1^{2}\qquad(12)$
$\sigma_B^{2}=\omega_0(\mu_0-\mu_T)^{2}+\omega_1(\mu_1-\mu_T)^{2}=\omega_0\omega_1(\mu_1-\mu_0)^2\qquad(13)$
$\sigma_T^{2}=\sum_{i=1}^{L}(i-\mu_T)^2p_i\qquad(14)$
又因为 $\sigma_W^{2}+\sigma_B^{2}=\sigma_T^{2}$ ,因此 $\kappa=\lambda+1$ ， $\eta=\frac{\lambda}{\lambda+1}$ ，都是关于 $\lambda$ 的函数，而 $\sigma_{W}^2$ 涉及二阶统计量（方差）， $\sigma_{B}^2$ 只涉及一阶统计量，因此，我们只需要选取其中最简单的 $\eta$ 求最大值即可。由于 $\sigma_T^2$ 与k的选取无关，因此最后的优化目标等同于最大化 $\sigma_B^2$ ,类间方差。

代码

def otsu(gray):
    pixel_number = gray.shape[0] * gray.shape[1]
    mean_weigth = 1.0/pixel_number
    # 发现bins必须写到257，否则255这个值只能分到[254,255)区间
    his, bins = np.histogram(gray, np.arange(0,257))
    final_thresh = -1
    final_value = -1
    intensity_arr = np.arange(256)
    for t in bins[1:-1]: # This goes from 1 to 254 uint8 range (Pretty sure wont be those values)
        pcb = np.sum(his[:t])
        pcf = np.sum(his[t:])
        Wb = pcb * mean_weigth
        Wf = pcf * mean_weigth

        mub = np.sum(intensity_arr[:t]*his[:t]) / float(pcb)
        muf = np.sum(intensity_arr[t:]*his[t:]) / float(pcf)
        #print mub, muf
        value = Wb * Wf * (mub - muf) ** 2

        if value > final_value:
            final_thresh = t
            final_value = value
    final_img = gray.copy()
    print(final_thresh)
    final_img[gray > final_thresh] = 255
    final_img[gray < final_thresh] = 0
    return final_img