最强目标检测算法YOLOv4论文解读

本文仅为笔者个人浅显的理解,如各位发现有误的地方欢迎指正。

一、概述

YOLO v4中,作者做了很多实验,把近年比较火的一些方法加入YOLO中,最终取得了速度和精度的提升。通过了解YOLO v4,我们就可以知道最近几年有哪些方法被提出来,整篇论文更像是一篇综述。

YOLO v4中使用的方法

加权残差连接(WRC)跨阶段部分连接(CSP)交叉小批量归一化(CMBN)自动对抗训练(SAT)MISH激活镶嵌数据增强CmBNDROPBOLD正则化CIOU损失目标检测算法比较

通过上图可以看出,在MSCOCO数据集上,YOLO v4和其它比较先进的目标检测算法比较,从速度和精度综合来看,明显优于其它算法。

目标检测器

一阶段、二阶段目标检测器的区别

YOLO v4中Neek使用的是PANet

目标检测主要分为以下三个支系(multi-stage系已被淘汰):

二、Bag of freebies

只增加训练成本,但是能显著提高精度的一些方法

数据增强

光度畸变:调整亮度、对比度、色调、饱和度和噪声几何畸变:随机缩放、剪切、翻转、旋转风格迁移模拟遮挡

随机擦除,填充随机或互补的0值随机或均匀的选择图像中的多个矩形区域,并将其全部替换为0Feature map(特征图上进行数据增强)

DropOutDropConnectDropBlock结合多图像一起进行数据增强

MixUpCutMix图像风格迁移

使用图像风格迁移进行数据增强

BBox

YOLO v4使用了CIoU(Complete-IoU)作为Box回归函数,CIoU可以在BBox回归问题上获得更好的收敛速度和精度。

先计算两个框的最小闭包区域面积Ac(同时包含预测框和真实框的最小框的面积),再计算出IoU,再计算闭包区域中不属于两个框的区域占闭包区域的比重,最后用IoU减去这个比重得到GIoU。

三、Bag of specials

只增加少量预测成本,但是能显著提高精度的一些方法

扩充接收域

SPPASPPRFB注意力机制

Squeeze-and-Excitation(SE) 可让ResNet50在分类任务上提高1%精度,但会增加10%的GPU推理时间Spatial Attention(SAM) 可让ResNet50在分类任务上提高0.5%精度,且不会增加GPU推理时间所以YOLO v4使用了Spatial Attention(SAM)这种方法

特征集成

早期:skip connetion、hyper-column融合不同特征金字塔的轻量级模型:SFAM、ASFF、BiFPN、SFAM激活函数

ReLU解决了tann和sigmoid的梯度消失问题 LReLU,PReLU,ReLU6,SELU,Swish,hard-Swish,Mish,其中Swish和Mish都是连续可微的激活函数

后处理方法

NMSSoft-NMS:解决对象遮挡问题DloU NMS:将中心点距离的信息添加到BBox筛选过程中YOLO v4用到的方法

Mish activation、CSP、MiWRC、SPP-block、SAM、PAN、DloU-MNS

四、网络结构的选择

神经网络用于图像分类的参数

backbone:CSPDarknet53additional module:SPPneck:PANethead:YOLOv3(anchor based)五、比较

各种目标检测模型和YOLOv4比较

欢迎大家加入【人工智能学习圈】参与交流!

原文链接:https://zhuanlan.zhihu.com/p/140964314

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值