A Simple Pooling-Based Design for Real-Time Salient Object Detection

最新推荐文章于 2020-09-28 00:27:20 发布

沙雅云

最新推荐文章于 2020-09-28 00:27:20 发布

阅读量344

点赞数

分类专栏：目标检测

本文链接：https://blog.csdn.net/yychentracy/article/details/97131431

版权

目标检测专栏收录该内容

48 篇文章 5 订阅

订阅专栏

基于池化技术的显著性目标检测
Abstract
引入了GGM（global guidance module ）（针对不用的特征层提供突出目标的位置信息）和FAM（feature aggregation module）（特征整合模块，将corse-level 特征与fine -level水平的特征进行融合，）这两种pooling模块可以使得高级语义特征逐步的细化，生成细节丰富的显著性映射，并且可以准确的定位具有锐化细节的突出目标。
intruduction
传统的方法都是用手工标记的特诊去捕捉局部和整体的特征，但是缺乏高层语义信息，导致整体的检测水平不是很高。但是卷积神经网络可以很好地提取高层的语义信息也可以很好地提取底层的细节信息。由于这种金字塔结构，浅层有更大的尺寸空间，丰富的细节底层信息，高层丰富的语义信息更善于确定突出物体的位置。u-shape结构在分类网络上构建自顶向下的路径来构建丰富的特征图。
高层像浅层传递信息的时候，被高层网络捕捉的位置信息也渐渐的被稀释掉了
另外cnn的感受野与深度不成正比，目前的解决方法主要有，将注意力机制引入u-shape结构，集合多尺度信息，挥着对于显著性图增加额外的约束来，反复细化特征图。
在这里插入图片描述
PPM放在backbone的顶层可以更好地捕捉到全局的信息，通过GGFs流可以更好地将PPM搜集到的语义信息分发到金字塔各层的feature map。，这样很好的防止高层语义信息在传递的过程中被稀释的问题。
FAM将融合后的特征区作为输入，首先将融合后的特征图转换到多个尺度空间，去捕捉不同尺度的局部上下文信息，组合这些信息更好地权衡融合的输入特征映射的组成。
这是第一篇利用设计池化模块来改良显著性目标检测的性能的文章。
作者还加入边缘检测分支，同和联合训练和模型和边缘检测，进一步锐化突出目标的细节。
速度是30fps，5000张图片需要六个小时，比之前的方法要快很多，主要是使用了一些池化技巧，这个可以作为未来显著性目标检测的一个baseline。
conclusion
这篇文章，设计了两种池化模块，探索了池化对于显著性目标检测的一些细节的贡献，GGM和FAM。把这个两个模块加入FPN结构中，我们这个poolNet模块比之前的其他模块都要好很多。将边缘检测的信息加入我们的网络可以更好的改善端到端的训练技能，我们的网络结构式独立的，并且可以更好地运用到金字塔基础模块，提供了一种有希望的方式来提高显著性特征图的质量。