解读Top-Down Modulation for object detection

本文探讨了在卷积神经网络中,通过Top-Down Modulation增强目标检测性能的方法。通过自顶向下的神经网络和侧向连接,网络能够结合高层语义和低层细节特征,尤其在小物体识别上取得显著提升。实验结果显示,该方法在COCO数据集上提高了平均准确率,验证了其有效性。
摘要由CSDN通过智能技术生成

一、概述
卷积神经网络中,卷积层和池化层导致了最终层学习到粗糙的,高度语义化的特征。但是,在识别像瓶子,遥控器小物体时,更需要诸如水平及竖直边缘这样的细节特征。而这些细节特征正是卷积神经网络在位置靠前的卷积层所要学习的。
为了捕捉这些细节特征,各种skip connection方法很流行。但是简单的融合高维度skip feature由于维度灾难导致的过拟合,并不会明显提升网络性能。那么,解决方案就在top-down modulation里。我们用一个自顶向下的神经网络补充经典的自底向上的前馈网络,用侧向连接连接它们。这些连接是用来调制和选择底层特征,而自顶向下的神经网络负责融合特征。经典前馈卷积网络获取的高层语义特征,由自顶向下的网络反馈回来,经过侧向连接处理后,在中间层与原特征融合,进一步向下传递。最终这些特征继承地拥有了局部及更大的感受野。本方法使用InceptionResNet-v2的初步实验得到了36.8的平均准确率,这是不用多尺度迭代改善的单个模型的最佳结果。并且,在小物体识别上获取了极大提升,说明了基于高层语义的细节特征提取很重要。


二、网络解析
2.1 网络结构及单元结构
网络结构设计如图:
这里写图片描述
图1 网络整体结构
核心思想

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值