YOLOv10:实时端到端检测

论文地址:https://arxiv.org/abs/2405.14458
代码地址:https://github.com/THU-MIG/yolov10?tab=readme-ov-file

在过去的几年里,YOLO(You Only Look Once)因其在计算成本和检测性能之间的有效平衡而成为实时对象检测领域的主要范式。研究人员已经探索了YOLO的架构设计、优化目标、数据增强策略等,并取得了显著进展。然而,对非极大值抑制(NMS)作为后处理手段的依赖阻碍了YOLO的端到端部署,并对推理延迟产生了不利影响。
本文旨在从后处理和模型架构两个方面进一步推进YOLO的性能-效率边界。本文首先提出了针对YOLO的无NMS训练的一致双重分配方法,该方法同时带来了具有竞争力的性能和较低的推理延迟。此外,介绍了针对YOLO的全面的效率和精度驱动模型设计策略。从效率和准确性的角度对YOLO的各个组件进行了全面优化,减少了计算开销并增强了模型的能力。得到新一代的YOLO系列,用于实时端到端对象检测,被称为YOLOv10。
广泛的实验表明,YOLOv10在各种模型规模下都达到了最先进的性能和效率。例如,YOLOv10-S在类似COCO数据集上的平均精度(AP)下,比RT-DETR-R18快1.8倍,同时参数和浮点运算(FLOPs)数量仅为后者的2.8倍。与YOLOv9-C相比,YOLOv10-B在相同性能下,延迟降低了46%,参数减少了25%。

主要改进包括:
(1)首先,解决后处理中的冗余预测问题,提出了一个一致的双重分配策略,用于无NMS的YOLO,具有双重标签分配和一致的匹配度量。它允许模型在训练过程中享受丰富而和谐的监督,同时在推理过程中无需NMS,从而以高效率实现竞争性能。
在这里插入图片描述

(2)其次,通过对YOLO中各个组件的全面检查,提出了整体效率-精度驱动的模型架构设计策略。为了提高效率,提出了轻量级分类头,空间通道解耦下采样和秩引导块设计,以减少表现出的计算冗余,实现更高效的架构。
(3)探索大内核卷积,并提出了有效的部分自注意模块来增强模型能力,利用低成本下的性能改进潜力。

实验部分
在COCO 数据集上验证了所提出的检测器。此外,所有模型的计算都在T4 GPU上使用TensorRT FP16进行了测试。
在这里插入图片描述

  • 4
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值