Deep Embedding Features for Salient Object Detection
本文是来自AAAI2019 accept的一篇关于显著性目标检测的paper
Abstract
得益于卷积神经网络的快速发展,通过利用一些多层级的卷积特征,一些显著性检测方法已经取得了卓越的结果。然而,由于像素级别的标注的高成本,这些显著性训练数据集是非常受限的,这也导致训练好的model在新的场景测试时会表现出来受限的泛化性。除此之外,一些基于FCN的方法直接整合多层特征,忽略了在特征中的噪声对显著性检测是有害的这个事实。在这篇文章中,我们提出将先验信息转换为一个嵌入空间用来去选择注意的特征并且排除离群值的用于显著性检测的方法。我们的网络首先通过encoder-decoder产生一个粗略的prediction map,然后训练一个FEN将粗糙的map中的每一个像素映衬到一个计量空间,这样可以合并许多能够突出显著性区域而抑制非显著性区域的响应的注意力特征。接下来,将embedded feature通过一个deep-to-shallow的RFIN来提纯,用以提高prediction map的细节信息。再者,为了消除模糊的边界,我们提出了一个GRFN去共同的优化预测的结果和学习到的guidance maps。在五个基准数据集上的大量实验证实了我们的方法胜过一些最优的方法的结果,我们的方法是端到端的,并且可以达到一个38FPS的实时速度。
注:未完待续!