[论文阅读]YOLOF:You Only Look One-level Feature

题目:You Only Look One-level Feature
作者:

motivation:
作者想分析下FPN为什么对模型效果影响很大,理论创新性还是蛮大的。

methods:
这是一个新的只使用32倍下采样的C5特征图的目标检测框架。
主要贡献:
1)作者分析了MiMo(多进多出)、单进多出(SiMo)、多进单出(MiSo)和单进单出(SiSo)编码器的收益,并发现IDEAR
2)作者首先对编码器的结构进行了适当的设计,以提取不同尺度目标的多尺度上下文特征,弥补多尺度特征的不足;
3)然后,作者采用均衡匹配机制来解决单特征图中稀疏anchor引起的正样本不平衡问题。

FPN主要有两个核心的收益:一方面,FPN可以进行多尺度特征融合,它将多个尺度的特征图融合在一起获得更好的表示;另一方面,它又是一种分治策略,依据目标的不同尺度在不同级别的特征图上检测目标。

在这里插入图片描述

作者在RetinaNet的基础上通过解耦多尺度特征融合和分治功能设计了实验。具体而言,将FPN视作一个多进多出(Multiple-in-Multiple-out,MiMo)编码器,它从骨干网络编码多尺度特征并且为解码器即检测head提供特征表示。作者对MiMo(多进多出)、单进多出(SiMo)、多进单出(MiSo)和单进单出(SiSo)编码器进行了对比实验,结果如下图。

在这里插入图片描述
这些实验结果表明两个事实:第一,C5特征图上其实就包含了检测各种尺度目标的足够的上下文信息,这就导致SiMo编码器可以获得相当不错的效果;第二,多尺度特征融合带来的收益要远远小于分治策略带来的收益,因此多尺度特征融合在FPN不是最关键的功能。

将原始特征图和扩大感受野的特征图加到一起,就能得到覆盖所有目标尺度的特征图了,这个过程其实可以通过残差连接构造膨胀模块实现,称为Dilated Encoder。
在这里插入图片描述
基于上面的讨论,作者设计了如上图所示的SiSo结构,名为Dilated Encoder。它包含先后两个组件,分别是Projector和Residual Blocks。投影层首先应用一个1×1的卷积层来降低通道维数,然后添加一个3×3卷积层来细化上下文语义信息,这与FPN一致。然后,叠加连续4个卷积核膨胀率不同的残差块,生成具有多个感受野的输出特征,覆盖所有对象的尺度。

大GT框比小GT框会产生更多的正anchor,从而造成了正anchor的不平衡问题。这会导致检测器只关注大目标的训练,而忽略小目标检测的优化。
在这里插入图片描述
因此,作者设计了一个均衡匹配(Uniform Matching)策略,即对每个GT框而言,只采用最接近的k个anchor作为正anchor,这就能如上图一样保证每个GT框不论尺寸大小都有相同数目的正anchor。平衡的正样本确保所有的GT框平等地参与训练。同样,作者也设置阈值来过滤大IoU的负样本和小IoU的正样本。

experiments:
还是直接上图哈
在这里插入图片描述
在这里插入图片描述
【完结】

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
"YOLO:统一、实时的目标检测"简称YOLO,是一种深度学习算法,用于实时目标检测。它的核心思想是将目标检测问题转化为单个统一的回归问题,使得只需一次前向传播即可直接预测出目标的位置和类别。 相比于传统的目标检测方法,YOLO具有显著的优势。首先,YOLO采用了统一的网络结构,端到端地完成整个目标检测过程。这意味着不需要将图像分割成多个部分进行处理,减少了冗余计算,提高了计算效率。 其次,YOLO实时性能出色。它将目标检测任务与边界框回归深度学习模型相结合,使得可以在一次前向传播中同时预测出多个目标的位置和类别。因此,YOLO在速度上远远超过了传统的基于滑窗的目标检测方法。 此外,YOLO还采用了多尺度的特征图来检测不同大小的目标。通过在不同层级的特征图上进行预测,YOLO可以有效地捕捉目标的多尺度信息,并提高了目标检测的准确性。 然而,YOLO也存在一些局限性。由于采用了统一的网络结构,YOLO对小尺寸的目标检测相对较差。此外,当目标之间存在重叠或者遮挡时,YOLO可能会出现漏检或者虚警的情况。 总而言之,YOLO是一种统一、实时的目标检测算法,具有高效、准确的特点。它在图像处理、智能安防、自动驾驶等领域具有广泛的应用前景。然而,为了提升其性能,在处理小尺寸目标和目标重叠等复杂场景时,仍需要不断的研究和优化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值