参考博客:https://blog.csdn.net/u014380165/article/details/81556769
1. 概述
目前表现突出的目标检测器都依赖较深的网络结构,因为越深层的网络,特征表示能力越强,但无疑带来了较大的计算量。反过来,出现了一些轻量级的网络,实现了实时检测,但检测精度不容乐观。
在本文中,我们探索了一种替代方案,受到人类视觉系统的RFs的构建,我们提出了一种新颖的RF(RFB)模块,该模块模拟人类感受野可以增强网络特征提取能力,以增强特征可辨性和鲁棒性。在SSD的基础上,于最顶层增加RFB模块,RFB Net。
本文贡献有三:
一,提出RFB模块,旨在增强轻量级CNN网络的深层功能;
二,构建RFB Net,将SSD中的一部分卷积层替换为RFB模块;
三,在COCO和VOC数据集上测试RFB Net,在速度和精度上同时取得很好的效果,并通过将RFB链接到MobileNet来展示RFB的泛化能力。
2.网络结构
RFB是一个多分支的卷积模块,内部结构可以被划分为两部分:使用不同卷积核的多分支卷积层,扩张池化或者扩张卷积。
前者和inception相同,模拟多种尺寸的pRF。后一部分再现了人类感受野可以增强网络特征提取能力。
在下图中,分别采用不同的rate进行空洞卷积,最后