You Only Look One-level Feature

参考博客目标检测算法YOLOF:You Only Look One-level Feature_我爱计算机视觉的博客-CSDN博客

研究了什么

根据作者介绍FPN有两个优点-,一是多尺度融合(融合多个低分辨率和高分辨率的输入,获取更好的表示),二是分而治之(根据对象的尺度检测不同级别的对象)。

然后作者就研究这两个优点哪一个对一阶段检测器的贡献程度更大,进而研究得到一个新的算法。

研究方法是什么

作者提出的YoloF。

YOLOF的示意图如下:

由三个模块组成,Backbone-ResNet   ,   Encoder(Dilated Encoder) ,   Decoder

编码器(Encoder)处理Backbone提取的特征,将处理结果传输给解码器(Decoder)用于分类和回归。

FPN可以视为MiMo(Multiple-in-Multiple-out)编码器,然后作者将其与SiMo(Single-in-Multiple-out)、MiSo(Multiple-in-Single-out)、SiSo(Single-in-Single-out)编码器一起进行比较。如下图所示:

可得:

1、SiMo编码器虽然只有一个输入特征C5,但是它的表现与和MiMo相媲美,说明C5特征包含足够的信息来检测物体。

2、MiSo、SiSo编码器的表现下降了很多,说明使用“分治法”将目标检测问题以目标尺寸为依据分解为多个子问题,对于构建高性能网络的贡献很大。

所以作者提出了YoloF算法,它的输入仅仅是C5特征,同时避免使用上图中图(b)的SiMo复杂结构,而是使用了图(d)的SiSo结构以减少计算量。

研究过程是什么

基于当把MIMO作为编码器时,与SISO作为编码器时相比,其内存负担非常大,而且编码时速度慢很多的不足。作者提出用简单的SISO替代MIMO,速度提高了但是精度下降了很多。这个原因有两个:一是感受野的尺寸范围是有限的,二是正锚不均。为了能够保持检测器简单、准确和快速的同时能够解决优化问题,提出YoloF算法。

1 解决感受野尺寸范围有限问题

C5特征的感受野所对应的目标尺寸范围是受限的,无法应对目标检测场景中变化剧烈的目标尺寸

(a)使用C5特征作为输入的SiSo Encoder

(b)通过堆叠标准和空洞卷积(Dilated Convolution),增大C5特征的感受野,虽然能够有效地表达尺寸较大的目标,但对小目标表达能力变差。

(c)作者提出了一个SiSo Encoder的新结构,将其称作Dilated Encoder,该结构能够融合多种尺寸的感受野,从而能检测尺寸变化范围大的多种目标。
 

使用Dilated Encoder模块代替FPN 

介绍Dilated Encoder-两个部分组成(Projector 和Residual Blocks)

        Dilated Encoder将Backbone输出的C5特征作为输入,使用1x1卷积减少通道数目,接着使用3x3卷积精炼语义信息,然后是4个连续的空洞残差单元(Dilated Residual Block),这4个空洞残差单元中3x3卷积的dilation rate不一定相等。使用4个连续的空洞残差单元可以在one-level feature中包含具有多种不同感受野的特征,以应对不同的目标尺寸。

2 解决positive anchor不均匀问题

        为了解决正锚不均问题,作者提出了Uniform Matching方法,对于每个目标,都将和该目标ground truth最近的k个anchor作为该目标的positive anchor,从而保证每个目标都有相同数量的positive anchor。

结论是什么

1、通过实验分析了FPN成功的最重要原因,即使用分治法(divide-and-conquer)解决目标检测问题;

2、提出Dilated Encoder结构用来提取多尺寸感受野的特征,替代了FPN,减小了模型复杂度和计算量;

3、使用Uniform Matching方法解决positive anchor在尺寸不同的目标上分布不均匀的问题;

4、以Dilated Encoder代替RetinaNet中的FPN模块,构建了YOLOF,并通过实验证明了YOLOF的高效性。
 

涉及的一些知识


详解FPN网络_越来越胖的GuanRunwei的博客-CSDN博客_fpn(利用卷积网络本身带有的层次性语义特征,来构建特征金字塔)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值