Hello, 今天是论文阅读计划的第19天啦~
也是我在这30天中要介绍的最后一篇目标检测的论文啦
一、背景
最显著的目标检测方法使用的基本结构是三角网或特征金字塔网络(FPN)。这些方法忽略了编码器与解码器交换信息时的两个关键问题:一是它们之间缺乏干扰控制,二是没有考虑不同编码器块贡献的差异。在这项工作中,我们提出了一个简单的门控网络来同时解决这两个问题。
众所周知,解码器中预测的高质量显著图严重依赖于编码器提供的有效特征。然而,上述方法直接使用all-pass skip-layer结构来将编码器的特征连接到解码器,并且不同级别的特征聚集的有效性没有被量化。这些限制不仅将误导性的上下文信息引入解码器,而且导致真正有用的特征不能被充分利用。在认知科学中,杨等人表明,抑制性神经元在人类大脑如何选择处理呈现给我们的所有信息中最重要的信息方面起着重要作用。抑制性神经元通过抑制其他神经元和平衡刺激神经元活动的兴奋性神经元来确保人类对外部刺激做出适当的反应。受此启发,我们认为在显著性检测中,有必要在每对编码器和解码器块之间建立一个信息筛选单元。它可以帮助区分显著区域的最强烈特征,并抑制背景干扰。
此外,由于感受野有限,单尺度卷积编码难以捕捉大小变化物体的上下文信息。然而,当使用大膨胀率的卷积时,由于插入太多的零,核下的信息严重缺乏相关性。这可能不利于细微图像结构的辨别。
二、研究内容 & 贡献
本文提出了一种用于显著目标检测的简单选通网络,设计了一种新颖的门控双分支结构来建立不同层次特征之间的协作,提高整个网络的可区分性。基于特征金字塔网络(FPN),我们构建了多级门单元来组合来自解码器和编码器的特征。我们使用卷积运算和非线性函数来计算特征之间的