A Simple Pooling-Based Design for Real-Time Salient Object Detection------论文理解

最新推荐文章于 2022-02-25 18:33:51 发布

ruoruojiaojiao

最新推荐文章于 2022-02-25 18:33:51 发布

阅读量4.9k

点赞数 3

分类专栏：深度学习计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ruoruojiaojiao/article/details/89519806

版权

本文提出了一种改进的显著对象检测方法，通过在特征金字塔网络中加入全局指导模块（GGM）和特征聚合模块（FAM）。GGM利用金字塔池化获取全局信息并传递至各级特征图，FAM则处理不同尺度特征的融合，同时，模型还联合训练边缘检测以增强细节。实验表明，这种方法提高了显著对象检测的准确性。

摘要由CSDN通过智能技术生成

论文链接： https://arxiv.org/abs/1904.09569

1. 摘要

本文将通过扩展卷积神经网络中的池化部分来解决显著目标检测问题。

在特征金字塔的基础上，在bottom-up途径上加入GGM模块（global guidance module），旨在为不同特征层提供潜在显著对象的位置信息。在top-down途径加入FAM模块（feature aggregation module），将粗糙级的特征和细致级的特征进行更好的融合。这两个基于池化的模块允许逐步重新定义高级语义特征，从而产生细节丰富的显著性特征图。实验结果表明，我们提出的方法能够更准确地定位具有锐化细节的突出物体，从而大大提高了与以往技术水平相比的性能。

2. 概述

基于U型结构的网络（如特征金字塔）能够通过在分类网络上构建自上而下的路径来构建丰富的特征图，因此受到最多的关注。
（也就是说U型框架得到的语义信息更多。）但仍然有很大的提升空间。

首先，高级语义信息逐渐传输到较浅层，因此较深层捕获的位置信息可以同时逐渐稀释；
（U型网络中bottom-up阶段产生高级语义信息，再通过top-down阶段上采样，并与bottom-up阶段横向连接，虽然会将粗糙信息和细致信息连接起来，但同样会导致高级语义信息中的位置信息逐渐被稀释。）

其次，CNN的感受野尺寸与其层深度不成比例。
࿰

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。