A Simple Pooling-Based Design for Real-Time Salient Object Detection

基于池化技术的显著性目标检测
Abstract
引入了GGM(global guidance module )(针对不用的特征层提供突出目标的位置信息)和FAM(feature aggregation module)(特征整合模块,将corse-level 特征与fine -level水平的特征进行融合,)这两种pooling模块可以使得高级语义特征逐步的细化,生成细节丰富的显著性映射,并且可以准确的定位具有锐化细节的突出目标。
intruduction
传统的方法都是用手工标记的特诊去捕捉局部和整体的特征,但是缺乏高层语义信息,导致整体的检测水平不是很高。但是卷积神经网络可以很好地提取高层的语义信息也可以很好地提取底层的细节信息。由于这种金字塔结构,浅层有更大的尺寸空间,丰富的细节底层信息,高层丰富的语义信息更善于确定突出物体的位置。u-shape结构在分类网络上构建自顶向下的路径来构建丰富的特征图。
高层像浅层传递信息的时候,被高层网络捕捉的位置信息也渐渐的被稀释掉了
另外cnn的感受野与深度不成正比,目前的解决方法主要有,将注意力机制引入u-shape结构,集合多尺度信息,挥着对于显著性图增加额外的约束来,反复细化特征图。
在这里插入图片描述
PPM放在backbone的顶层可以更好地捕捉到全局的信息,通过GGFs流可以更好地将PPM搜集到的语义信息分发到金字塔各层的feature map。,这样很好的防止高层语义信息在传递的过程中被稀释的问题。
FAM将融合后的特征区作为输入,首先将融合后的特征图转换到多个尺度空间,去捕捉不同尺度的局部上下文信息,组合这些信息更好地权衡融合的输入特征映射的组成。
这是第一篇利用设计池化模块来改良显著性目标检测的性能的文章。
作者还加入边缘检测分支,同和联合训练和模型和边缘检测,进一步锐化突出目标的细节。
速度是30fps,5000张图片需要六个小时,比之前的方法要快很多,主要是使用了一些池化技巧,这个可以作为未来显著性目标检测的一个baseline。
conclusion
这篇文章,设计了两种池化模块,探索了池化对于显著性目标检测的一些细节的贡献,GGM和FAM。把这个两个模块加入FPN结构中,我们这个poolNet模块比之前的其他模块都要好很多。将边缘检测的信息加入我们的网络可以更好的改善端到端的训练技能,我们的网络结构式独立的,并且可以更好地运用到金字塔基础模块,提供了一种有希望的方式来提高显著性特征图的质量。

关于中间的GGM和FAM的详细介绍以及实验部分会在后面的博客在写
文章下载链接https://arxiv.org/pdf/1904.09569v1.pdf

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值