论文地址:Efficient Inference in Fully Connected CRFs with Gaussian Edge Potentials
这篇论文介绍了一种使用全接连CRFs进行图像分割的方式,不同于之前CRF只是对相邻的节点进行操作,全连接是对所有节点进行操作,但是这样会导致一个问题,使用传统的推断方式会计算量巨大,因此本文还提出了一种新的使用高维滤波进行卷积的推断方式可以使全连接的推断时间缩短很多
随机场定义如下
求在I的条件下X的概率,其中I为输入图像,X为每个像素点的标签
为标签的集合,一共有k种标签,也就是k种分类
势能函数为,C为图中的每个最大包
我们使用最大后验估计(maximum a posteriori (MAP))来进行x的估计
为了方便起见,在后续的论文中我们使用来代替
我们定义是势能函数为
其中为一元势能,只能该i点上的值有关,在这篇论文中使用了TextonBoost并且加入了颜色,梯度直方图(HOG)和像素位置等特征
为二元势能,表示各个节点之间的关系,使用了
其中,P为像素点的位置,I为像素点的RGB值
fcCRFs中的高效推断
上边提到了如果使用传统的推断方法进行fcCRFs的推断速度会非常慢,因此本文提出了一种全新的推断方式,能够使推断速度大幅增强
1、平均场估计(Mean Field Approximation)
这种方式使用KL散度D(Q||P)进行Q(x)的估计来代替直接计算P(x)
迭代算法如下
每次迭代都包含了三个部分:消息传递(Message passing)、相容变换(compatibility transform)、局部更新(local update)
其中瓶颈是消息传递,因此本文提出了一种新的消息传递方式
2、使用高纬度滤波的高效消息传递方式
可以使用高斯核进行卷积来表示消息传递过程
训练过程
请见翻译
https://blog.csdn.net/ahnu120705097/article/details/78913675