SAMNet: Stereoscopically Attentive Multi-scale Network for Lightweight Salient Object Detection
显著性物体检测的轻量级立体注意力多尺度网络
原文链接:https://www.researchgate.net/publication/350161009_SAMNet_Stereoscopically_Attentive_Multi-Scale_Network_for_Lightweight_Salient_Object_Detection
作者:Yun Liu*, Xin-Yu Zhang*, Jia-Wang Bian, Le Zhang, Ming-Ming Cheng
摘要:近年来在显著目标检测(SOD)方面的进展主要得益于卷积神经网络(CNNs)的爆炸性发展。然而,大部分的改进来自于更大的网络规模和更重的计算开销,在我们看来,这并不友好,在实践中难以部署。为了推广更实用的SOD系统,我们引入了一种新的立体注意力多尺度(SAM)模块,它采用了立体注意力机制,自适应地融合了不同尺度的特征。在这个模块上,我们提出了一个非常轻量级的网络,用于SOD,即SAMNet。在流行基准上进行的大量实验表明,对于仅使用1.33M参数的336×336的输入,在343fps的GPU速度和5fps的CPU速度下运行时,所提出的SAMNet与最先进的方法具有相当的精度。
文章概述
本文针对现有的显著性目标检测方法普遍存在网络规模越来越大,计算量大的问题,提出了一个轻量级的立体注意力多尺度模块。
骨干网:使用所提出的SAM模块作为基本单元,构建一个FCN结构。
多尺度融合:输入特征图的多尺度融合;立体注意力多尺度融合。
立体注意力机制:元素相乘的方式将空间注意力和通道注意力融合。
SAMNet的整体编码器-解码器架构。Si和Ri分别表示第i阶段编码器和解码器的输出特征图。Pi为第i阶段预测的显著性图,P1为SAMNet的最终预测。G是ground-truth。PPM表示著名的金字塔池化模块。