RFB-Net论文笔记

  1. 大致介绍
    a. 大家都懂,较深的网络能力强但是比较慢,轻量化的小网络快但是准确率不足(VGG都算小网络了吗…)。那么有没有一种又快又强的网络呢,于是我们考虑通过对轻量化网络的特征进行强化的方式来提高效果。
    b. Receptive Field:俗称感受野。也就是每一块能感知到的原图的范围,感受野越大,包含的语义信息也就越多,也更能得到全局的信息,反之则比较偏向局部。本文将感受野的大小和离心率联系起来,也就是像人类的视觉一样,更关注中心的信息。提出了一个新的模块:RF Block
    c. 本文主要贡献如下:
    i. 提出了RFB模块,用于加强深层特征。
    ii. 提出了基于RFB的检测网络,替换了SSD的顶部卷积层,得到了不错的效果。
    iii. 通过与MobileNet的连接,展现了泛化能力。

  2. 关键模块与相关概念
    a. Dilated convolution:膨胀卷积,空洞卷积。这种卷积在普通卷积的基础上引入了一个rate的参数,在卷积时跳过一些像素。这样就可以在不改变参数,不降采样的情况下,增加了感受野,现在越来越常用的技术。
    在这里插入图片描述

  3. ASPP:空洞卷积空间金字塔池化,这是在DeepLab中提出的一种方法,将不同采样率的空洞卷积并行操作然后整合。使得在同一的尺度下,融合了不同尺度的信息。但是由于之前的卷积层的卷积大小都是一样的,也就是对于所有的位置都是看作等价的,就有可能会导致物体信息和环境信息的混淆。

  4. Deformable CNN:没看过,不了解
    在这里插入图片描述
    d. Receptive Field Block:介是一个你从未体验过的全新模块。这是一个多路的卷积快,有点像Inception。包含两层,第一层是不同大小的卷积,第二层是不同大小的且与前一层对应的空洞的卷积。其中FRFB-s模块用33的卷积替代55卷积,用13和31卷积替代3*3卷积。增加了路数,使用了更小的卷积核,减少了参数,增加了非线性。还加入了Shortcut。

  5. RFB Net 检测结构
    在这里插入图片描述
    a. 采用轻量化的网络,VGG16,去掉全连接层,修改为下采样的卷积层,最后一个池化层,也改为卷积层。
    b. 多尺度:此部分的结构和SSD一致,但是将前两层的,有着较高的分辨率的特征图部分,改为RFB模块。
    c. 实验结果:
    在这里插入图片描述
    a. 可以看到和SSD比,效率还是有所降低的,但仍算是较快的方法。而在准确率上则是超过了state-of-the-art。在COCO上的测试,虽然准确率不敌Retina-101-800,但是和500的模型相比,则准确率相近,速度更快。
    在这里插入图片描述
    b. 对各个模块效果的探究。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值