YOLOv4::Optimal Speed and Accuracy of Object 及code 各种新实现、配置、测试、训练资源）

最新推荐文章于 2024-06-30 15:59:08 发布

置顶

北漂奋斗者

最新推荐文章于 2024-06-30 15:59:08 发布

阅读量1.1k

点赞数 2

分类专栏：目标检测计算机视觉文章标签：深度学习机器学习

本文链接：https://blog.csdn.net/fg13821267836/article/details/105736498

版权

YOLOv4通过结合多种技术优化了目标检测，包括CSPDarknet53主干、SPP附加模块、PANet路径聚集颈和基于YOLOv3的头部。在MS COCO数据集上达到43.5% AP和65 FPS的速度，实现了速度和精度的平衡。文章详细介绍了方法、实验结果和相关工作。

摘要由CSDN通过智能技术生成

闲谈：

今年初 YOLO 之父Joseph Redmon宣布推出CV界，引起轩然大波，大家纷纷猜测YOLO是否不会再出v4版，退出历史舞台。

今天，YOLOv4重磅发布，作者为俄罗斯开发者 Alexey Bochkovskiy 和两位中国台湾开发者 Chien-Yao Wang、Hong-Yuan Mark Liao

YOLOv4 没有理论创新，而是在原有YOLO目标检测架构的基础上增加了近年CNN改进的众多技术，从数据处理到网络训练再到损失函数，遵行“拿来主义”，加上漂亮的工程实践，打造实现最佳速度与精度平衡的目标检测新基准！在MS COCO 数据集实现 43.5% AP (65.7% AP50 )，速度也更快了，在Tesla V100 GPU上 ∼65 FPS！

Abstract：

大量的特征提高卷积神经网络的准确性。对大型数据集上的特征的组合进行实践测试，并从理论上证明实验结果的正确性。针对特定的问题，一些特征仅在特定模型上运行，或者仅在小规模数据集上运行；然而某些功能（例如批归一化和残差连接）适用于大多数模型，任务和数据集。我们假设常见的特征包括Cross-Stage-Partial-connections (CSP), Cross mini-Batch
Normalization (CmBN), Self-adversarial-training (SAT)， Mish-activation.。我们使用以下新功能：WRC，CSP，CmBN，SAT， Mish-activation，Mosaic data augmentation，CmBN，DropBlock正则化和CIoU loss，并将其中的一部分以实现最新的结果：43.5％在Tesla V100上以65 FPS的实时速度获得MS COCO数据集的AP（65.7％AP50）。

Source code：https://github.com/AlexeyAB/darknet.

paper：https://arxiv.org/pdf/2004.10934v1.pdf

Introduction：

多数基于CNN的物体探测器在很大程度上仅适用于recommendation systems。例如，低精度模型已经被用在城市摄像机寻找免费停车位中，而汽车碰撞警告与快速不准确的模型有关。改善中实时物体检测器的准确性使得它们不仅用于生成提示的recommendation systems，而且也用于独立的进程管理和减少人工投入。运行在GPU上实时目标检测器可以以合适的价格实现大规模生产。最准确的现代神经网络不能实时运行并且在小批量训练需要多个GPU。我们利用一个CNN来处理这些问题，并且执行这些实时的检测在一个传统的GPU上，同时训练只需要一个传统的GPU。

这项工作的主要目标是设计生产系统中目标检测器快速运行速度并优化并行计算，而不是低计算量理论指标（BFLOP）。例如，任何使用常规GPU进行训练和测试的人都可以获得实时、高质量以及可信的目标检测结果。我们的贡献总结如下：

Related work

2.1 Object detection models

作者首先对现有目标检测方法进行了总结，无论是one-stage 、two-stage 还是 anchor free 、anchor based，均包含 Input、Backbone 、Neck、Heads（Dense Prediction或者Sparse Prediction）四部分。

近期的检测器通常由两部分组成，在ImageNet上预先训练的骨干和头部用于预测对象的类和边界框。对于在GPU平台上运行的检测器，backbone网可能是VGG [68]，ResNet [26]，ResNeXt [86]，或DenseNet [30]。对于在CPU平台上运行的检测器，的骨干网可能是SqueezeNet [31]，MobileNet[28，66，27，74]或ShuffleNet [97，53]。至于头部它通常分为两种，即一阶段对象
探测器和两级物体探测器。最有代表性两级物体检测器是R-CNN [19]系列，包括快速R-CNN [18]，更快的R-CNN [64]，R-FCN [9]，和Libra R-CNN [58]。也可以进行两阶段对象检测器无锚对象检测器，例如RepPoints [87]。一阶段物体检测器典型代表是Y

最低0.47元/天解锁文章

北漂奋斗者

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
YOLOv4::Optimal Speed and Accuracy of Object 及code 各种新实现、配置、测试、训练资源）

闲谈：今年初YOLO 之父Joseph Redmon宣布推出CV界，引起轩然大波，大家纷纷猜测YOLO是否不会再出v4版，退出历史舞台。今天，YOLOv4重磅发布，作者为俄罗斯开发者 Alexey Bochkovskiy 和两位中国台湾开发者 Chien-Yao Wang、Hong-Yuan Mark Liao YOLOv4 没有理论创新，而是在...
复制链接

扫一扫