原文在 Data Augmentation in YOLOv4
The “Secret” to YOLOv4 isn’t Architecture: It’s in Data Preparation.
目标检测领域继续快速发展。Google Brain团队发布了用于目标检测的EfficientDet,挑战了YOLOv3近实时目标检测的最优模型地位,并超越了对象检测的可能性。现在,YOLOv4已发布,其COCO平均精度(AP)和每秒帧数(FPS)分别提高了10%和12%。在本文中,我们将看到作者如何通过深入研究YOLOv4中使用的数据增强技术的细节来实现这一突破。
What is the Bag of Freebies in YOLOv4?
YOLOv4的作者在论文中提供了一系列贡献,并称之为“bag of freebies”。 这些是可以采取的一系列步骤,既可以提高模型的性能,又不会增加推理时的时间。 由于它们不会影响模型的推理时间,因此大多数改进了训练过程的数据管理和数据扩充。这些技术改进并扩大了训练集,以使模型暴露于原本看不见的情况下。计算机视觉中的数据增强是充分利用数据集的关键,而最新的研究仍在继续验证这一假设。
Data Augmentation in Computer Vision
图像增强会根据现有的训练数据创建新的训练示例。 对于我们的模型可能要负责推理的