论文作者不再是YOLO 之父 Joseph Redmon,而是来自俄罗斯的 Alexey Bochkovskiy和两位台湾开发者Chien-Yao Wang、Hong-Yuan Mark Liao。
论文地址:YOLOv4: Optimal Speed and Accuracy of Object Detection (Optimal :最优的)
Github
上已经有了一些代码:
-
YOLOv4 的 TensorFlow 2.0 实现:https://github.com/xiao9616/yolo4_tensorflow2
-
YOLOv4 的 TensorFlow 实现(持续更新):https://github.com/rrddcc/YOLOv4_tensorflow
-
YOLOv4 的 TensorFlow 实现:https://github.com/klauspa/Yolov4-tensorflow
-
YOLOv4 的 PyTorch 实现:https://github.com/GZQ0723/YoloV4
-
YOLOv4(TensorFlow后端)的 Keras 实现:https://github.com/Ma-Dan/keras-yolo4
-
YOLOv4 的 PyTorch 实现:https://github.com/Tianxiaomo/pytorch-YOLOv4
下面简单介绍下论文的方法,遇到新的点会说明下。
摘要
原文翻译:
有大量的技巧可以提高卷积神经网络(CNN)的精度。需要在大数据集下对这种技巧的组合进行实际测试,并对结果进行理论论证要求。某些技巧仅在某些模型上使用和专门针对某些问题,或只针对小规模的数据集;而一些技巧,如批处理归一化、残差连接等,适用于大多数的模型、任务和数据集。
我们假设这种通用的技巧包括:Weighted-Residual-Connection(WRC)、Cross-Stage-Partial-connections (CSP)、跨小型批量连接(CSP)、Cross mini-Batch Normalization(CmBN),Self-adversarial-trainin(SAT)和Mish-activation。
我们在本文中使用这些新的技巧:WRC、CSP、CmBN、SAT,Mish-activation,Mosaic data augmentation、CmBN、DropBlock正则化和CIoU损失,以及组合技巧,以达到最好的效果。在MS COCO数据集中的AP43.5%(65.7% AP50),在实际应用中,Tesla V100上速度可达到65FPS。
摘要说明了
:摘要一下子出现很多词汇,这些都是YOLOv4引进的各种技巧(论文涉及的技巧达20多个),正文会有说明。这些技巧一般来自顶会论文,有的技巧是在过拟合数据,而有些技巧则是真的适合通用模型。同时作者也做了大量大量的实验,可以说YOLOv4是一篇效果显著的实验报告了,也可以看作各种技巧的综述吧,因为论文引用量达到102篇。
同时论文也说明了最后选用了哪些技巧。
Tips
:技巧类的论文还有李沐老师的两篇论文,分别是
- 目标检测训练技巧:Bag of Freebies for Training Object Detection Neural Networks
- 分类训练技巧:Bag of Tricks for Image Classification with Convolutional Neural Networks
1 引言
这一部分主要是说明论文的目的:
设计生产系统中目标检测器的快速运行速度,优化并行计算,而不是低计算量理论指标 (BFLOP)。作者希望设