【经典论文解读】YOLOv4 目标检测

49 篇文章 78 订阅 ¥49.90 ¥99.00
54 篇文章 105 订阅
本文详细介绍了YOLOv4的目标检测技术,包括网络结构、输入端增强、BackBone层的CSPDarknet53、Neck中间层的SPP和PAN结构,以及Head输出层的多尺度特征检测和损失函数优化。通过Mosaic数据增强、cmBN、SAT等技术提升模型性能,结合CIOU_Loss和DIOU_nms改进检测精度。YOLOv4在速度与准确性上均有显著提升。
摘要由CSDN通过智能技术生成

前言

YOLO是一种目标检测方法,它的输入是整张图片,输出是n个物体的检测信息,可以识别出图中的物体的类别和位置。YOLOv4是在YOLOv3的基础上增加了很多实用的技巧,使得速度与精度都有较大提升。v4版本设计思路如下:

输入端:在模型训练阶段,使用了Mosaic数据增强、cmBN跨小批量标准化、SAT自对抗训练; 

BackBone层:也称主干网络,使用CSPDarknet53网络提取特征同时使用Mish激活函数、Dropblock正则化;CSP 跨阶段部分连接

Neck中间层:这是在BackBone与最后的Head输出层之间插入的一些层,Yolov4中添加了SPP模块、FPN+PAN结构;也支持“多尺度特征检测”,三种输出特征图分为19*19、38*38、76*76,对应检测大物体、中等物体、小物体。

Head输出层:输出层的锚框机制与YOLOv3相同,其中通过聚类提取先验框尺度,并约束预测边框的位置。主要改进的是训练时的损失函数CIOU_Loss,以及预测框筛选的DIOU_nms

论文地址:YOLOv4: Optimal Speed and Accuracy of Object Detection

Pytorch-YOLOv4 开源代码:https://github.com/Tianxiaomo/pytorch-YOLOv4

Tensorflow 2-YOLOv4 开源代码:https://github.com/hunglc007/tensorflow-yolov4-tflite

目录

一、网络结构 

1.1 输入输出映射

1.2整体网络结构

1.3 基础组件CBM

1.4 基础组件CBL

1.5 基础组件Res unit

1.6 基础组件CSPX

1.7 基础组件 SPP

二、输入端

 2.1 Mosaic数据增强

2.2 cmBN跨小批量标准化

2.3 SAT自对抗训练

三、BackBone层

3.1 CSPDarknet53

3.2 Mish激活函数

3.3 Dropblock正则化

四、Neck中间层

4.1 SPP模块

 4.2 PAN结构

5、Head输出层

5.1 多尺度特征检测

评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一颗小树x

您的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值