RFB-Net论文笔记

最新推荐文章于 2024-08-09 08:34:00 发布

HXACA_XMUT

最新推荐文章于 2024-08-09 08:34:00 发布

阅读量593

点赞数

分类专栏：论文笔记

本文链接：https://blog.csdn.net/l718531794/article/details/84398331

版权

论文笔记专栏收录该内容

14 篇文章 0 订阅

订阅专栏

大致介绍
a. 大家都懂，较深的网络能力强但是比较慢，轻量化的小网络快但是准确率不足（VGG都算小网络了吗…）。那么有没有一种又快又强的网络呢，于是我们考虑通过对轻量化网络的特征进行强化的方式来提高效果。
b. Receptive Field：俗称感受野。也就是每一块能感知到的原图的范围，感受野越大，包含的语义信息也就越多，也更能得到全局的信息，反之则比较偏向局部。本文将感受野的大小和离心率联系起来，也就是像人类的视觉一样，更关注中心的信息。提出了一个新的模块：RF Block
c. 本文主要贡献如下：
i. 提出了RFB模块，用于加强深层特征。
ii. 提出了基于RFB的检测网络，替换了SSD的顶部卷积层，得到了不错的效果。
iii. 通过与MobileNet的连接，展现了泛化能力。
关键模块与相关概念
a. Dilated convolution：膨胀卷积，空洞卷积。这种卷积在普通卷积的基础上引入了一个rate的参数，在卷积时跳过一些像素。这样就可以在不改变参数，不降采样的情况下，增加了感受野，现在越来越常用的技术。
ASPP：空洞卷积空间金字塔池化，这是在DeepLab中提出的一种方法，将不同采样率的空洞卷积并行操作然后整合。使得在同一的尺度下，融合了不同尺度的信息。但是由于之前的卷积层的卷积大小都是一样的，也就是对于所有的位置都是看作等价的，就有可能会导致物体信息和环境信息的混淆。
Deformable CNN：没看过，不了解

d. Receptive Field Block：介是一个你从未体验过的全新模块。这是一个多路的卷积快，有点像Inception。包含两层，第一层是不同大小的卷积，第二层是不同大小的且与前一层对应的空洞的卷积。其中FRFB-s模块用33的卷积替代55卷积，用13和31卷积替代3*3卷积。增加了路数，使用了更小的卷积核，减少了参数，增加了非线性。还加入了Shortcut。
RFB Net 检测结构

a. 采用轻量化的网络，VGG16，去掉全连接层，修改为下采样的卷积层，最后一个池化层，也改为卷积层。
b. 多尺度：此部分的结构和SSD一致，但是将前两层的，有着较高的分辨率的特征图部分，改为RFB模块。
c. 实验结果：

a. 可以看到和SSD比，效率还是有所降低的，但仍算是较快的方法。而在准确率上则是超过了state-of-the-art。在COCO上的测试，虽然准确率不敌Retina-101-800，但是和500的模型相比，则准确率相近，速度更快。

b. 对各个模块效果的探究。