显著性目标检测之Global Context-Aware Progressive Aggregation Network for Salient Object Detection(GCPANet)
文章目录
摘要
如今,对于显著性目标检测所需求的准确、有效和全面等方面的问题,深度卷积神经网络发挥了很不错的作用。以前的工作大多是采用多级特征集成而忽视了不同特征之间的差距。另外,高级特征在通过自上而下的通路时也存在一个稀释过程。为了补救这些问题,提出了一种名为GCPANet的新型网络,通过FIA模块( Feature Interweaved Aggregation) 和用一种监督方式生成的显著性地图,可以有效整合低级外观特征、高级语义特征和全局情景特征。除此之外,GCPANet还包括借助空间和通道方式响应来降低信息冗余、增强顶层特征的HA模块(Head Attention),被用来进一步完善和增强输入特征的SR模块( Self Refinement),还有为了学习不同显著性区域的联系、减轻高级特征的稀释影响而生成不同层次的全局情景信息的GCF模块( Global Context Flow)。实验依旧6个基准的数据集演示,发现在定性和定量上都明显优于目前最先进的方法。
简介
显著性目标检测应用范围
显著性目标检测应用范围非常广泛,例如图像理解,图像检索和目标跟踪等等。
显著性目标检测发展现状
近年来,深度学习的发展,尤其是完全卷积网络的出现极大地推动了显著性物体检测的发展。 完全卷积网络(FCN)堆叠了多个卷积层和池层,以逐渐扩大网络的接收范围并提取高级语义信息。完全卷积网络(FCN)堆叠了多个卷积层和池层,以逐渐扩大网络的接收范围并提取高级语义信息。如先前的工作所指出,由于金字塔状的CNN结构,低层特征通常,它们具有更大的空间大小和更细粒度的细节,而高级特征则倾向于获取更多的语义知识,并丢弃一些无意义或不相关的细节信息。一般而言,高级特征有利于显著性对象的粗略定位,而包含空间结构细节的低级特征则适合于细化边界。
显著性目标检测存在问题(基于FCN)
基于FCN的方法仍然存在一些问题:
(1)由于不同级别功能之间的差距,因此简单语义信息和外观信息的组合是不够的,并且没有考虑不同特征对显著性对象检测的不同贡献。
(2)以前的大多数作品都忽略了整体上下文信息,这有助于推断多个显着区域之间的关系并产生更多完整的显著性结果。