A Bayesian Approach to Digital Matting 论文阅读报道

yodala

已于 2022-05-09 14:46:46 修改

阅读量944

点赞数

分类专栏：论文文章标签：计算机视觉深度学习机器学习

于 2022-05-05 19:54:00 首次发布

本文链接：https://blog.csdn.net/yodala/article/details/124595485

版权

论文专栏收录该内容

8 篇文章 0 订阅

订阅专栏

本文详细介绍了图像抠图的各种方法，包括Matting方程、蓝幕抠图技术以及基于采样的方法如Mishima、Knockout、Ruzon-Tomasi和贝叶斯方法。这些方法通过不同策略估计像素的不透明度和前景、背景颜色，解决图像中前景与背景的分离问题。贝叶斯方法尤其涉及对前景和背景的统计建模，以找到最可能的α值。

摘要由CSDN通过智能技术生成

2022/05/05,06,08,09

樊俊
202121000460

Matting Equation

$C=\alpha F + (1-\alpha)B$
其中， $C$ 表示组合之后的图像的颜色， $F$ 表示组合之前的前景图像颜色， $B$ 表示组合的背景颜色， $\alpha$ 是像素的不透明度成分，用于在前景和背景之间线性融合。

Blue Screen Matting

拍摄前景目标在确定的背景上的图像，然后求解前景和透明度。
$R_c=\alpha R_f + (1-\alpha)R_b\\ G_c=\alpha G_f+(1-\alpha)G_b \\ B_c= \alpha B_f+(1-\alpha)B_b$
其中， $R_c,G_c,B_c),(R_b,G_b,B_b)$ 已知， $(R_f,G_f,B_f,\alpha)$ 未知。要求解4个未知数，但是只有三个方程，这显然是一个欠约束问题，因此要求解的话必须添加额外的约束条件。

基于采样的抠图方法

在自然图像抠图中，适当的人工交互是必要的。大多数抠图算法通过用户标记的三元图（Trimap）实现对对解空间的约束。三元图通过指定一部分已知的前景区域与已知的背景区域对图像进行标记，由用户涂鸦交互生成，或者由二值图像分割结果自动生成。
基于颜色采样的方法认为图像的局部区域是连续的，具有相似颜色的近邻像素，也具有相近的 $\alpha$ 值。
满足局部连续假设的像素在统计特征上具有相关性，通过采样未知像素周围近邻的已知前景、背景像素来估计 $\alpha$ 值。

已知黑色区域是背景( $\alpha=0,F=0,B=C$ )，白色区域是前景( $\alpha=1,F=C,B=0$ )，这两个区域的 $\alpha,F,B$ 都是已知的。目的是估计灰色区域的不确定的 $\alpha,F,B$ 。通过 matting 得到类似下面的结果。

Mishima

在这里插入图片描述

Mishima等人提出了一种解法。对于所有的背景采样点，计算这些采样点的最小包围，中心位置为 $\overline{B}$ ,然后对所有前景采样点，同样计算其最小包围。对于给定的组合后颜色 $C$ ，通过 $\overline{B}$ 和 $C$ 做射线，分别与前景包围线、背景包围线相交于 $F 、 B$ 点，那么
$\alpha= \frac{BC}{BF}$
该方法的缺陷：

需要在RGB空间中分别计算所有前景像素和背景像素的最小包围圈，即使简化成最小包围球体，计算量也较大；
处理结果依赖初始状态下对前景和背景的划分。

Knockout

计算每个颜色通道的 $\alpha$ 分量，加权平均作为最终的 $\alpha$ 值，也称三通道加权法。该方法简单、运算速度很快，但只适用于光滑图像的抠图。

对给定的不确定区域内的一点 $C$ ，计算所有前景区域的边缘像素与 $C$ 的加权均值。和 $C$ 最近的前景边缘像素点的权重设置为1，该权重随距离线性递减，距离为最近长度的两倍的像素点的权重为0。通过计算加权和得到前景 $F$ 。
通过同样的方法初始化背景 $B^{'}$ 。
过 $B^{'}$ 点，以 $\overrightarrow{FB'}$ 为法线得到平面 $S$ 。
将 $C$ 投影到 $S$ 得到点 $B$ 。
计算 $\alpha$ 。
$\alpha=\frac{f(C)-f(B)}{f(F)-f(B)}$
其中 $f ()$ 表示通过 $r g b$ 空间将颜色投影到某个可能的轴只上（e.g., onto one of the r-, g-, or b- axes）。

Ruzon-Tomasi

采用统计方法来估计 $\alpha$ 值，颜色估计和 $\alpha$ 值估计的计算量很大，处理速度非常慢。
在这里插入图片描述

Beyesian

将抠图问题表示为贝叶斯形式。贝叶斯方法假设前景和背景像素均服从高斯分布，先建立前景颜色的概率分布，再把未知区域的像素划分到前景或背景的不同簇中，表示当前选定的F概率有多大。
在这里插入图片描述
已知观察图 $C$ ,估计 $F,B,\alpha$ ，求概率分布 $P(F,B,\alpha | C)$ 取得最大值的时的 $F,B,\alpha$ ，即最大后验估计：
$\begin{aligned} &\argmax_{F,B,\alpha} P(F,B,\alpha | C)\\ &=\argmax_{F,B,\alpha} P(C|F,B,\alpha )P(F)P(B)P(\alpha)/P(C)\\ &=\argmax_{F,B,\alpha} L(C|F,B,\alpha )+L(F)+L(B)+L(\alpha) \end{aligned}$
其中 $L (\cdot)$ 是对数似然 $\log P(·)$ ，删除 $P (C)$ 项，因为它是关于优化参数的常数。
接下来就是对这个目标的三个似然项建模，然后求导优化

$L(C|F,B,\alpha)$
通过 Matting Equation 和 C 通过高斯分布来衡量颜色的差异
$L(C|F,B,\alpha)=-\frac{||C-\alpha F -(1-\alpha)B||^2}{\sigma^2_C}$
$L (F)$
未知区域的 $L (F)$ 可以看作未知区域的每个点是前景点的概率。计算该概率首先需要得到前景的分布，即前景分布的样本点均值和协方差矩阵，然后计算每个点到样本点均值的马氏距离的平方来衡量属于这个前景分布的概率，距离的平方越小，属于前景的“概率”就越大，取负即最大化似然项。
$\begin{aligned} L(F)&=-(F-\overset{-}{F})^{\top}\sum_{F}^{-1}(F-\overset{-}{F})\\ \overset{-}{F}&=\frac{1}{N}\sum_{i=1}^N F_i\\ \sum_F&=\frac{1}{N}\sum_{i=1}^N(F_i-\overset{-}{F})(F_i-\overset{-}{F})^{\top} \end{aligned}$
其中 $\overset{-}{F}$ 是前景分布的样本点均值向量（ $\times 1$ 向量, RGB三个灰度值）; $\sum_F$ 是前景分布的样本协方差矩阵（ $\times 3$ 矩阵）， $N$ 是样本点的数目。
但实际上计算前景分布，采用局部窗口估计（论文中是圆，取局部邻域 200 个点），同时局部窗口内，每个点的权重也是不同的！由两项组成，局部窗口内所有已知的前景点的透明度 $\alpha$ 和到窗口中心的距离，即
$w_i=\alpha_i \cdot G(i)$
其中，透明度 $\alpha$ 越高，越可能是前景点，用于估计前景分布的可信度就越高； $G (i)$ 是高斯距离加权函数，随着到窗口中心距离增大，权重越小。因此，对上面的似然项做更改
$\begin{aligned} L(F)&=-(F-\overset{-}{F})^{\top}\sum_{F}^{-1}(F-\overset{-}{F})\\ \overset{-}{F}&=\frac{1}{W}\sum_{i=1}^N w_iF_i\\ \sum_F&=\frac{1}{W}\sum_{i=1}^N w_i(F_i-\overset{-}{F})(F_i-\overset{-}{F})^{\top}\\ W&=\sum_{i=1}^n w_i \end{aligned}$
$L (B)$
解法与 $L (F)$ 一致，其中 $w_i=(1-\alpha_i)G(i)$ ,其中，透明度 $\alpha$ 越接近0，是背景点的概率就越大。
$L(B)=-(B-\overset{-}{B})^{\top}\sum_{B}^{-1}(B-\overset{-}{B})$
求解
论文提出的是，使用迭代求解的方法，先假设 $\alpha$ 不是变量，对 $F, B$ 求偏导，求解极值处的 $F, B$ ；然后假设 $F, B$ 不是变量，对 $\alpha$ 求偏导，求极值处的 $\alpha$ ，这样不断迭代直到收敛为止。在这个迭代求解的过程中，找出使得似然函数最大时对应的 $F,B,\alpha$ 作为最终结果。
$\alpha=\frac{(C-B)\cdot(F-B)}{||F-B||^2}$