You Only Look One-level Feature

oyou-2021

已于 2022-04-16 22:11:10 修改

阅读量2.8k

点赞数

分类专栏：论文阅读文章标签：算法

于 2022-04-16 11:08:00 首次发布

本文链接：https://blog.csdn.net/m0_63520910/article/details/124135366

版权

论文阅读专栏收录该内容

10 篇文章 0 订阅

订阅专栏

参考博客目标检测算法YOLOF：You Only Look One-level Feature_我爱计算机视觉的博客-CSDN博客

研究了什么

根据作者介绍FPN有两个优点-，一是多尺度融合（融合多个低分辨率和高分辨率的输入，获取更好的表示），二是分而治之（根据对象的尺度检测不同级别的对象）。

然后作者就研究这两个优点哪一个对一阶段检测器的贡献程度更大，进而研究得到一个新的算法。

研究方法是什么

作者提出的YoloF。

YOLOF的示意图如下：

由三个模块组成，Backbone-ResNet ， Encoder（Dilated Encoder）， Decoder

编码器（Encoder）处理Backbone提取的特征，将处理结果传输给解码器（Decoder）用于分类和回归。

FPN可以视为MiMo（Multiple-in-Multiple-out）编码器，然后作者将其与SiMo（Single-in-Multiple-out）、MiSo（Multiple-in-Single-out）、SiSo（Single-in-Single-out）编码器一起进行比较。如下图所示：

可得：

1、SiMo编码器虽然只有一个输入特征C5，但是它的表现与和MiMo相媲美，说明C5特征包含足够的信息来检测物体。

2、MiSo、SiSo编码器的表现下降了很多，说明使用“分治法”将目标检测问题以目标尺寸为依据分解为多个子问题，对于构建高性能网络的贡献很大。

所以作者提出了YoloF算法，它的输入仅仅是C5特征，同时避免使用上图中图（b）的SiMo复杂结构，而是使用了图（d）的SiSo结构以减少计算量。

研究过程是什么

基于当把MIMO作为编码器时，与SISO作为编码器时相比，其内存负担非常大，而且编码时速度慢很多的不足。作者提出用简单的SISO替代MIMO，速度提高了但是精度下降了很多。这个原因有两个：一是感受野的尺寸范围是有限的，二是正锚不均。为了能够保持检测器简单、准确和快速的同时能够解决优化问题，提出YoloF算法。

1 解决感受野尺寸范围有限问题

C5特征的感受野所对应的目标尺寸范围是受限的，无法应对目标检测场景中变化剧烈的目标尺寸

（a）使用C5特征作为输入的SiSo Encoder

（b）通过堆叠标准和空洞卷积（Dilated Convolution），增大C5特征的感受野，虽然能够有效地表达尺寸较大的目标，但对小目标表达能力变差。

（c）作者提出了一个SiSo Encoder的新结构，将其称作Dilated Encoder，该结构能够融合多种尺寸的感受野，从而能检测尺寸变化范围大的多种目标。

使用Dilated Encoder模块代替FPN

介绍Dilated Encoder-两个部分组成（Projector 和Residual Blocks）

Dilated Encoder将Backbone输出的C5特征作为输入，使用1x1卷积减少通道数目，接着使用3x3卷积精炼语义信息，然后是4个连续的空洞残差单元（Dilated Residual Block），这4个空洞残差单元中3x3卷积的dilation rate不一定相等。使用4个连续的空洞残差单元可以在one-level feature中包含具有多种不同感受野的特征，以应对不同的目标尺寸。

2 解决positive anchor不均匀问题

为了解决正锚不均问题，作者提出了Uniform Matching方法，对于每个目标，都将和该目标ground truth最近的k个anchor作为该目标的positive anchor，从而保证每个目标都有相同数量的positive anchor。

结论是什么

1、通过实验分析了FPN成功的最重要原因，即使用分治法（divide-and-conquer）解决目标检测问题；

2、提出Dilated Encoder结构用来提取多尺寸感受野的特征，替代了FPN，减小了模型复杂度和计算量；

3、使用Uniform Matching方法解决positive anchor在尺寸不同的目标上分布不均匀的问题；

4、以Dilated Encoder代替RetinaNet中的FPN模块，构建了YOLOF，并通过实验证明了YOLOF的高效性。

涉及的一些知识

详解FPN网络_越来越胖的GuanRunwei的博客-CSDN博客_fpn(利用卷积网络本身带有的层次性语义特征，来构建特征金字塔）