SAM显著性检测模型
本文特点:
1、相比之前做显著性检测的模型,本文最大的特点是采用了neural attentive mechanism
这种机制是什么意思,给出原文的解释(自己不太明白):
Machine attention [16] is a computational paradigm which aims to compute an output as a weighted sum of different parts of the input, by selectively attending to different parts of the input itself via a compatibility function
人眼的选择性注意机制大概是经过类似全局扫描非常快速的决定大概的需要关注的位置之后,依次的看下一个感兴趣的物体,而看的顺序是由重要性决定(可以认为是显著性程度),本文类似引入这种显著性程度引导saliency map的修正。(个人理解)
2、除此之外,人眼观察图像时是有中心偏置的(更倾向于观察图像中心的部分),这在一定程度上是由于收集数据时人眼位于图像正中间的位置,本文显式的学习一种中心偏置,而不是人为提供。且与之前的一篇学习偏置的方法不同(ML-net),两篇论文是同一个作者。
3、在损失函数上做了一定的改进
如下,有一张模型对比图: