【文献学习】具有高斯边缘势能的全连接CRF的高效推理

本文介绍了Philipp在NIPS和CVPR上发表的关于全连接条件随机场(CRF)的研究,针对图像分割任务提出了一种高效近似推理算法。传统CRF模型的限制被全连接CRF克服,允许像素级别的密集连接,改善了分割和标记的精度。文章详细阐述了全连接CRF的模型构建、能量函数以及平均场近似的推理方法,并探讨了长距离连接在图像分割中的价值。此外,还提供了源码实现和相关参考文献。
摘要由CSDN通过智能技术生成

一、文章简介

     《 Efficient Inference in Fully Connected CRFs with Gaussian Edge Potentials》是Philipp发表在NIPS(Neural Information Processing Systems,2011和CVPR(IEEE Conference on Computer Vision and Pattern Recognition,2012)上的最佳学生论文,所属领域为segmentation. 

二、摘要

        目前,大部分最先进的多类别图像分割算法都使用基于像素或者区域的CRFs.虽然区域级模型通常具有密集的成对连接性,但像素级模型相当大,且只允许使用稀疏图形结构.在本文中,考虑在图像中的完整像素集上定义的全连接CRFs模型,得到图像数十亿的边缘,使得传统的推理算法不切实际。本文的主要贡献是对于全连接CRFs模型进行高效近似推理算法,其中成对边缘势能使用高斯核的线性组合定义。实验表明,像素级的密集连接大大提高了分割和标记的精度。


三、引言

       在处理多类图像分割和标签任务时,常见的方法是将这个问题作为在像素或图像补丁上定义的条件随机场(CRF)中的最大后验(MAP)推理。CRF势能包含了使相似像素之间的标签一致性最大化的平滑度项,且可以整合模拟对象类之间的上下文关系的更精细的项。
        基础CRF模型由基于单个像素或者图像块的一元势能和基于相邻像素或图像补丁的成对势能组成。所产生的相邻CRF结构在图像中建立长距离连接的能力受到限制,且通常导致对象边界的过度平滑.为改进分割和标签精度,有人将基础CRF框架扩展到基于图像区域定义的分层连接和高阶势。但是这种方法的精度严重依赖于无监督图像分割的准确性,这限制了基于区域方法的在复杂目标边界周围产生准确标签分配的能力。
       本文的主要贡献就是建立了一个高效的全连接CRF模型推理算法,算法是基于平均场近似成CRF分布。所得到的近似推理算法在模式中的边缘数量上是亚线性的. 

四、CRF模型

       CRF(Conditional random fields)是一种基于概率论和图论的判别式理论框架的机器学习理论CRF结合了最大熵模型(Maximum Entropy Markov ModelsMEMM)和隐马尔夫模型(Hidden Markov ModelsHMM)的优点。与HMM 相比,CRF放松了HMM 的两个独立性假设(输出独立性假设和马尔夫性假设);而与MEMM和其他马尔夫判别式概率模型相比,CRF具有表达长距离依赖性和交叠性特征的能力,能够较好地解决标记偏置问题的优点,而且所有特征可以进行全局归一化,能够求得全局最优解。它在图像标记中具有直接后验概率建模的优势,它具有以统一的概率框架融合多特征,以及表达上下文信息和语义信息的能力,特别是定义在超像素集上的CRF模型。

  • 10
    点赞
  • 39
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值