目标检测算法之YOLO（YOLOv10）

本文链接：https://blog.csdn.net/weixin_52862386/article/details/139968142

yolo算法理解

Background
Consistent Dual Assignments for NMS-free Training
Holistic Efficiency-Accuracy Driven Model Design
Conclusion

Background

yolov10是清华大学发布的一个新yolo算法，作者认为NMS是影响yolo实时推理的一个主要问题，针对这个问题提出了dual assignments的方法来训练NMS-free的yolo模型。同时作者从速度和精度入手，提出了几个改进模型的方法。yolov10在推理速度以及参数量上都优于现有的模型，且仍具有不弱于其他模型的精度。接下来主要分析yolov10中的dual asignments和 Efficiency-Accuracy优化策略。

yolov10的论文地址：https://arxiv.org/abs/2405.14458
yolov10的代码地址：https://github.com/THU-MIG/yolov10

Consistent Dual Assignments for NMS-free Training

作者认为one-to-many label assign需要NMS进行后处理，从而影响模型部署后的推理速度，然而one-to-one label assign会带来额外的推理开销并且没有太好的表现。
基于这俩个原因，提出了dual label assignmets的策略，即在yolo中同时采用one-one和one-to-many。模型的结构见下图
在这里插入图片描述
从上图可以看出，相较于普通的yolo头，这里的yolo头有俩个，分别用于one-to-one和one-to-many。同时每个头都采用了解耦头的方式，即回归和分类分开。这里的思想跟v7中的辅助头是挺像的，通过一个aux head实现one-to-many，lead head实现one-to-one。最后在推理阶段丢弃aux head。

引入了俩个头之后，最大的问题就是如何去分配标签。这里作者对俩个头都用了一样的匹配度量。这里匹配度量的仍然是考虑了分类头和回归头，这里匹配损失记为 $m$ ，具体计算如下 $m(\alpha,\beta) = s\cdot p^{\alpha}\cdot IOU(\hat{b},b)^{\beta}$ 其中 $p$ 是指分类分数， $\hat{b}$ 为预测框， $b$ 为真实框， $\alpha$ 和 $\beta$ 是超参数。
这样度量就同时考虑了分类任务和回归任务。对于one-to-one的任务记为 $m_{o2o} = m_{o2o}(\alpha_{o2o},\beta_{o2o})$ ，对于one-to-many的任务记为 $m_{o2m}=m_{o2m}(\alpha_{o2m},\beta_{o2m})$ 。