【文献学习】具有高斯边缘势能的全连接CRF的高效推理

最新推荐文章于 2021-02-25 09:48:53 发布

依依依依然

最新推荐文章于 2021-02-25 09:48:53 发布

阅读量7.3k

点赞数 10

文章标签：全连接条件随机场图像分割

本文链接：https://blog.csdn.net/wang_yao501/article/details/78913170

版权

本文介绍了Philipp在NIPS和CVPR上发表的关于全连接条件随机场（CRF）的研究，针对图像分割任务提出了一种高效近似推理算法。传统CRF模型的限制被全连接CRF克服，允许像素级别的密集连接，改善了分割和标记的精度。文章详细阐述了全连接CRF的模型构建、能量函数以及平均场近似的推理方法，并探讨了长距离连接在图像分割中的价值。此外，还提供了源码实现和相关参考文献。

摘要由CSDN通过智能技术生成

一、文章简介

《 Efficient Inference in Fully Connected CRFs with Gaussian Edge Potentials》是Philipp发表在NIPS（Neural Information Processing Systems，2011）和CVPR（IEEE Conference on Computer Vision and Pattern Recognition，2012）上的最佳学生论文，所属领域为segmentation.

二、摘要

目前，大部分最先进的多类别图像分割算法都使用基于像素或者区域的CRFs.虽然区域级模型通常具有密集的成对连接性，但像素级模型相当大，且只允许使用稀疏图形结构.在本文中，考虑在图像中的完整像素集上定义的全连接CRFs模型，得到图像数十亿的边缘，使得传统的推理算法不切实际。本文的主要贡献是对于全连接CRFs模型进行高效近似推理算法，其中成对边缘势能使用高斯核的线性组合定义。实验表明，像素级的密集连接大大提高了分割和标记的精度。

三、引言

在处理多类图像分割和标签任务时，常见的方法是将这个问题作为在像素或图像补丁上定义的条件随机场（CRF）中的最大后验（MAP）推理。CRF势能包含了使相似像素之间的标签一致性最大化的平滑度项，且可以整合模拟对象类之间的上下文关系的更精细的项。
基础CRF模型由基于单个像素或者图像块的一元势能和基于相邻像素或图像补丁的成对势能组成。所产生的相邻CRF结构在图像中建立长距离连接的能力受到限制，且通常导致对象边界的过度平滑.为改进分割和标签精度，有人将基础CRF框架扩展到基于图像区域定义的分层连接和高阶势。但是这种方法的精度严重依赖于无监督图像分割的准确性，这限制了基于区域方法的在复杂目标边界周围产生准确标签分配的能力。
本文的主要贡献就是建立了一个高效的全连接CRF模型推理算法，算法是基于平均场近似成CRF分布。所得到的近似推理算法在模式中的边缘数量上是亚线性的.

四、CRF模型

CRF(Conditional random fields)是一种基于概率论和图论的判别式理论框架的机器学习理论，CRF结合了最大熵模型（Maximum Entropy Markov Models，MEMM）和隐马尔可夫模型（Hidden Markov Models，HMM）的优点。与HMM 相比，CRF放松了HMM 的两个独立性假设（输出独立性假设和马尔可夫性假设）；而与MEMM和其他马尔可夫判别式概率模型相比，CRF具有表达长距离依赖性和交叠性特征的能力，能够较好地解决标记偏置问题的优点，而且所有特征可以进行全局归一化，能够求得全局最优解。它在图像标记中具有直接后验概率建模的优势，它具有以统一的概率框架融合多特征，以及表达上下文信息和语义信息的能力，特别是定义在超像素集上的CRF模型。