《Residual Bi-Fusion Feature Pyramid Network for Accurate Single-shot Object Detection》论文笔记

本文介绍了Residual Bi-Fusion Feature Pyramid Network在提高单次目标检测准确性中的作用。通过结合FPN、残差连接、CORE模块和BFM模块,解决了小目标检测中的定位问题,提升了网络的语义表达和鲁棒性。实验表明,这些改进有效提高了检测性能。
摘要由CSDN通过智能技术生成

参考代码:

1. 概述

导读:在检测任务中一般会引入FPN增强在不同尺度下网络的检测性能,但是只通过top-down的FPN网络是很难去重建由于特征图的漂移(水平或是垂直方向运动)在经过pooling操作(pooling不具有平移不变性)带来结果相差很大的问题(特别针对小目标),而且FPN带来的性能提升会在使用较多卷积层之后逐渐被稀释(卷积的平移不变形),进而会导致一些小目标定位性能降低。对此可以通过添加一个bottom-up的结构实现对特征图pooling经过操作之后带来的问题补偿,但是却需要消耗很多额外的资源。对此文章提出了残差特征金字塔(residual feature pyramid),通过深层和浅层特征的双向连接构建一个对大目标和小目标都高效且鲁棒的检测器。由于其中使用了残差连接,类比于ResNet文章的网络可以较容易地完成训练,该结构的移植性也很强,而且在添加更多网络层的时候其性能不会像传统FPN网络那样导致FPN带来的提升逐渐下降。

在检测网络中一般会使用FPN来增强网络的特征表达,但是FPN网路却对pooling操作(不具备平移不变性)对平移敏感性不足,这就导致其对于小目标就存在天然的劣势,一个解决办法是添加bottom-up的结构,但是这样会增加很多开销。对此文章通过在top-down的结构上添加一些增强语义特征的结构:残差特征金字塔和BFM模块,从而极大增强了网络语义信息的表达。

PS:这篇文章的方法在纸面上看起来很好,但是其实现的细节在文章中讲解的并不清楚,比

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值