DetectoRS论文学习笔记

最新推荐文章于 2023-07-07 11:24:11 发布

tomeasure

最新推荐文章于 2023-07-07 11:24:11 发布

阅读量1.8k

点赞数 3

分类专栏：目标检测 CV 深度学习文章标签：深度学习神经网络 DetectoRS 目标检测

本文链接：https://blog.csdn.net/qq_29695701/article/details/106610917

版权

深度学习同时被 3 个专栏收录

45 篇文章 3 订阅

订阅专栏

24 篇文章 2 订阅

订阅专栏

目标检测

19 篇文章 1 订阅

订阅专栏

原论文：《Siyuan Qiao, Liang-Chieh Chen, Alan Yuille. DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution[J]. arXiv:2006.02334》
最后面有 参考代码 的 Github 链接
仅描述基本构成，原论文内容很丰富，所以详细情况还是要看论文。
效果：

论文的两个特点：

将 FPN 改为 RFP（Recursive Feature Pyramid）；
将普通卷积改为 SAC（Switchable Atrous Convolution）。

1. RFP

在这里插入图片描述

将原始RPN每层的输出 $f_i^1$ 反馈进同层骨干网，得到 $f_i^2$ ，具体反馈的方式是：
- 使用 ASPP模块 对 $f_i^1$ 进行变换，得到 $R_i$ ；
- 修改接收 $R_i$ 的骨干网中对应的模块；
最后将 $f_i^1$ 与 $f_i^2$ 利用 Fusion模块 融合，得到最终的特征图；
骨干网模块中接收 $R_i$ 的方式：

1.1 ASPP（Atrous Spatial Pyramid Pooling）

输入： $f_i^1$ （通道为 $c$ ）
输出： $R_i^1$ （通道为 $c$ ）
结构：

四个并行的卷积分支，每个分支的输出的通道为 $c / 4$ 。
其中三个分支由 Conv+ReLU 构成，相关参数： $kernel\ size=[1,3,3],\ atrous\ rate=[1,3,6],\ padding=[0,3,6]$ 。
第四个分支： $global\ average\ pooling+Conv\_1\times1+ReLU+resize$ 。
将四个分支连接在一起得到 $R_i^1$ 。

1.2 Fusion

在这里插入图片描述
输入： $f_i^1$ 与 $f_i^2$
输出：最终要使用的特征图

2. SAC

在这里插入图片描述

结构： $(Pre)Global\ Context+SAC+(Post)Global\ Context$
中间部分的 SAC 计算公式：
$Output=S(x)\cdot Conv(x,w,1)+(1-S(x))\cdot Conv(x,w+\Delta w,r)$
其中， $S(x)=average\ pooling\_5\times 5+Conv\_1\times 1$