YOLOv10：实时端到端检测

ONENERVE

已于 2024-05-26 18:19:38 修改

阅读量437

点赞数 4

文章标签： YOLO 计算机视觉人工智能目标检测

于 2024-05-26 18:17:25 首次发布

本文链接：https://blog.csdn.net/ONENERVE/article/details/139218321

版权

论文地址：https://arxiv.org/abs/2405.14458
代码地址：https://github.com/THU-MIG/yolov10?tab=readme-ov-file

在过去的几年里，YOLO（You Only Look Once）因其在计算成本和检测性能之间的有效平衡而成为实时对象检测领域的主要范式。研究人员已经探索了YOLO的架构设计、优化目标、数据增强策略等，并取得了显著进展。然而，对非极大值抑制（NMS）作为后处理手段的依赖阻碍了YOLO的端到端部署，并对推理延迟产生了不利影响。
本文旨在从后处理和模型架构两个方面进一步推进YOLO的性能-效率边界。本文首先提出了针对YOLO的无NMS训练的一致双重分配方法，该方法同时带来了具有竞争力的性能和较低的推理延迟。此外，介绍了针对YOLO的全面的效率和精度驱动模型设计策略。从效率和准确性的角度对YOLO的各个组件进行了全面优化，减少了计算开销并增强了模型的能力。得到新一代的YOLO系列，用于实时端到端对象检测，被称为YOLOv10。
广泛的实验表明，YOLOv10在各种模型规模下都达到了最先进的性能和效率。例如，YOLOv10-S在类似COCO数据集上的平均精度（AP）下，比RT-DETR-R18快1.8倍，同时参数和浮点运算（FLOPs）数量仅为后者的2.8倍。与YOLOv9-C相比，YOLOv10-B在相同性能下，延迟降低了46%，参数减少了25%。

主要改进包括：
（1）首先，解决后处理中的冗余预测问题，提出了一个一致的双重分配策略，用于无NMS的YOLO，具有双重标签分配和一致的匹配度量。它允许模型在训练过程中享受丰富而和谐的监督，同时在推理过程中无需NMS，从而以高效率实现竞争性能。
在这里插入图片描述