【目标检测】46、YOLOv4 | AlexeyAB大神接棒 引入其他模块来实现更快更好的 YOLO 网络

在这里插入图片描述

论文:YOLOv4: Optimal speed and accuracy of object detection

代码:https://github.com/AlexeyAB/darknet

作者:AlexeyAB

时间:2020.08

一、背景

由于实际应用中有很多需要达到实时检测的效果,如高速自动驾驶,所以本文作者致力于设计一个快速的检测器,称为 YOLOv4,其结果如图 1 所示,贡献点如下:

  • 设计了一个又快又好的检测器
  • 验证了很多 Bag of Freebies 和 Bag of Specials 方法的效果
  • 证明了现有的 SOTA 的方法可以更有效并且在单个 GPU 上训练

YOLOv4 将目标检测器分为了 4 个部分:

  • Input:Image、Patches、Image Pyramid
  • Backbone:VGG-16、ResNet、EfficientNet 等
  • Neck:
    • Additional blocks:SPP、ASPP、RFB、SAM 等
    • Path-aggregation blocks:FPN、PAN、NAS-FPN、ASFF 等
  • Heads:
    • Dense Prediction(one-stage):
      • RPN、SSD、YOLO、RetinaNet(anchor based)
      • CornerNet、CenterNet、FCOS(anchor free)
    • Sparse Prediction(two-stage):
      • Faster RCNN、R-FCN、Mask RCNN(anchor based)
      • RepPoints(anchor free)

在这里插入图片描述

在这里插入图片描述

二、方法

2.1 BoS 和 BoF

Bag of Freebies:指的是那些不增加模型复杂度,也不增加推理的计算量的训练方法技巧,来提高模型的准确度

Bag-of-Specials:指的是那些增加少许模型复杂度或计算量的训练技巧,但可以显著提高模型的准确度

BoF指的是:

  • 数据增强:图像几何变换(随机缩放,裁剪,旋转),Cutmix,Mosaic等
  • 网络正则化:Dropout、Dropblock等
  • 损失函数的设计:边界框回归的损失函数的改进 CIOU

BoS指的是:

  • 增大模型感受野:SPP、ASPP等
  • 引入注意力机制:SE、SAM
  • 特征集成:PAN,BiFPN
  • 激活函数改进:Swish、Mish
  • 后处理方法改进:soft NMS、DIoU NMS

2.2 YOLOv4 的结构

YOLOv4 由以下三个部分组成,使用了很多 BoF 和 BoS:

  • Backbone:CSPDarknet53
  • Neck:SPP, PAN
  • Head:YOLOv3

使用的策略:

  • Backbone:

    • BoF: CutMix and Mosaic data augmentation, DropBlock regularization, Class label smoothing
    • BoS: Mish activation, Cross-stage partial connections (CSP), Multiinput weighted residual connections (MiWRC)
  • detector:

    • BoF: CIoU-loss, CmBN, DropBlock regularization, Mosaic data augmentation, Self-Adversarial Training, Eliminate grid sensitivity, Using multiple anchors for a single ground truth, Cosine annealing scheduler [52], Optimal hyperparameters, Random training shapes
    • BoS: Mish activation, SPP-block, SAM-block, PAN path-aggregation block, DIoU-NMS

三、效果

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

呆呆的猫

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值