该模型的代码开源(作者提供了MATLAB的代码和数据集)
本文在玻尔兹曼机和ShapeBM的基础上提出了单隐含层的MMBM1和双隐含层的MMBM2,其实本文最大的新意之一在于将观察层(原始图像的特征)连接到隐含层和可见层,这个优点就是此时我们能够直接从图像特征来推断对象的形状(即分割对象)。
图1 文章提出的两种模型
这里引用摘要部分的翻译来简述文章的主要工作:本文针对物体分割提出了最大边界的玻尔兹曼机,它作为模型化隐层变量和对于输入观测的输出标签的联合分布的条件玻尔兹曼机的一个主要算法之一。除了图想到标签的连接,我们也建立了图想到隐层的链接来促进全局形状预测,从而得出一个简单迭代条件模型算法,以为后验概率推断提供效率。同时,我们为判别训练建立了最大边界目标函数,并且在学习过程过程中分析了不同边界函数的影响;最后本文在三种数据集上对提出的算法作了评估。
1 该模型的代码开源(作者提供了MATLAB的代码和数据集)
摘要:本文针对物体分割提出了最大边界的玻尔兹曼机,它作为模型化隐层变量和对于输入观测的输出标签的联合分布的条件玻尔兹曼机的一个主要算法之一。除了图想到标签的连接,我们也建立了图想到隐层的链接来促进全局形状预测,从而得出一个简单迭代条件模型算法,以为后验概率推断提供效率。同时,我们为判别训练建立了最大边界目标函数,并且在学习过程过程中分析了不同边界函数的影响;最后本文在三种数据集上对提出的算法作了评估。
2 介绍
本文提出了针对普适类的条件玻尔兹曼机的对象分割模型,本文模型除了从图像到标签的连接,也包含从图像到隐层变量的连接,这个好处是允许我们从图像特征直接进行形状推断;同时我们也推导出适用于最大后验推断的高效迭代式条件模型。
针对CRF和CBM模型面对指数级输出组合的问题,近似学习算法易陷入局部最优解;而我们提出的给予最大边界的CBM能够高效地解决这个问题
相比已提出的最大边界的玻尔兹曼机主要针对理论的研究,我们提出的方法主要在于图像分割上的应用;同时和基于超像素CRF和基于高阶模式的方法在三种数据集上进行对比分析。
2 相关的工作
这里首先对现有的方法作了分析,然后指出在上述的提到的方法,在图像特征和隐变量之间的唯一的推理路径推进将标签分配给图像像素,然而却将这个形状仅仅使其作为先验信息起作用,因此这个形状信息没有被完全开发研究。相反,我们的MMBM介绍了隐变量和图像特征间的连接,这种做法使得MAP推断程序更加高效,从而有助于最大边界学习。
3 模型
首先,在这里介绍了两种玻尔兹曼机的变体,RBMs和ShapeBM为模型化对象形状;其次描述了本文提出的条件模型和最大后延推断算法。
3.1 玻尔兹曼机
给定一个对象有标签的图像,我们能够将mast表示为可见变量y