【经典论文解读】YOLOv4 目标检测

最新推荐文章于 2024-08-06 16:18:03 发布

一颗小树x

最新推荐文章于 2024-08-06 16:18:03 发布

阅读量7.3k

点赞数 23

分类专栏：人工智能感知算法文章标签： YOLO 目标检测 YOLOv4 CSPDarknet53 PAN

本文链接：https://blog.csdn.net/qq_41204464/article/details/119673960

版权

感知算法同时被 2 个专栏收录

49 篇文章 78 订阅 ¥49.90 ¥99.00

订阅专栏

人工智能

54 篇文章 105 订阅

订阅专栏

本文详细介绍了YOLOv4的目标检测技术，包括网络结构、输入端增强、BackBone层的CSPDarknet53、Neck中间层的SPP和PAN结构，以及Head输出层的多尺度特征检测和损失函数优化。通过Mosaic数据增强、cmBN、SAT等技术提升模型性能，结合CIOU_Loss和DIOU_nms改进检测精度。YOLOv4在速度与准确性上均有显著提升。

摘要由CSDN通过智能技术生成

前言

YOLO是一种目标检测方法，它的输入是整张图片，输出是n个物体的检测信息，可以识别出图中的物体的类别和位置。YOLOv4是在YOLOv3的基础上增加了很多实用的技巧，使得速度与精度都有较大提升。v4版本设计思路如下：

输入端：在模型训练阶段，使用了Mosaic数据增强、cmBN跨小批量标准化、SAT自对抗训练；

BackBone层：也称主干网络，使用CSPDarknet53网络提取特征；同时使用Mish激活函数、Dropblock正则化；CSP 跨阶段部分连接。

Neck中间层：这是在BackBone与最后的Head输出层之间插入的一些层，Yolov4中添加了SPP模块、FPN+PAN结构；也支持“多尺度特征检测”，三种输出特征图分为19*19、38*38、76*76，对应检测大物体、中等物体、小物体。

Head输出层：输出层的锚框机制与YOLOv3相同，其中通过聚类提取先验框尺度，并约束预测边框的位置。主要改进的是训练时的损失函数CIOU_Loss，以及预测框筛选的DIOU_nms。