特征融合篇 | YOLOv8 引入长颈特征融合网络 Giraffe FPN

迪菲赫尔曼

已于 2024-01-22 09:33:17 修改

阅读量3.7k

点赞数 1

分类专栏： YOLOv8改进实战🚀 文章标签： YOLO ultralytics GFPN FPN DAMO-YOLO

于 2024-01-21 22:31:03 首次发布

原创文章为博主个人所有，未经授权不得转载、摘编、传播、倒卖、洗稿或利用其它方式使用上述作品。违反上述声明者，本站将追求其相关法律责任。

本文链接：https://blog.csdn.net/weixin_43694096/article/details/135730418

版权

YOLOv8改进实战🚀 专栏收录该内容

153 篇文章 ¥299.90 ¥399.90

订阅专栏

DAMO-YOLO是一种基于YOLO的高性能目标检测方法，通过引入MAE-NAS、RepGFPN、ZeroHead、AlignedOTA和蒸馏增强等技术，实现不同尺度模型的高性能和低延迟。在COCO数据集上，DAMO-YOLO-T/S/M/L和轻量级模型在保持高精度的同时，满足了不同计算资源的需求。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在这里插入图片描述

请添加图片描述

在本报告中，我们介绍了一种名为DAMO-YOLO的快速而准确的目标检测方法，其性能优于现有的YOLO系列。DAMO-YOLO是在YOLO的基础上通过引入一些新技术而扩展的，这些技术包括神经架构搜索（NAS）、高效的重参数化广义FPN（RepGFPN）、带有AlignedOTA标签分配的轻量级头部以及蒸馏增强。特别地，我们使用MAE-NAS，一种受最大熵原理指导的方法，在低延迟和高性能的约束下搜索我们的检测骨干网络，生成类似ResNet / CSP的结构，带有空间金字塔池化和聚焦模块。在颈部和头部的设计中，我们遵循“大颈，小头”的原则。我们引入了具有加速的queen-fusion的广义FPN来构建检测器颈部，并通过高效的层聚合网络（ELAN）和重参数化来升级其CSPNet。然后，我们研究了检测器头部大小对检测性能的影响，并发现具有仅一个任务投影层的重颈部会产生更好的结果。此外，我们提出了AlignedOTA来解决标签分配中的错位问题。还引入了一种蒸馏方案，以将性能提升到更高水平。基于这些新技术，我们构建了一系列不同尺度的模型，以满足不同场景的需求。对于一般的工业需求，我们提出了DAMO-YOLO-T/S/M/L。它们在COCO上的性能分别为43.6/47.7/50.2/51.9 mAPs，对应于T4 GPU上的延迟为2.78/3.83/5.62/7.95 ms。此外，对于计算能力有限的边缘设备，我们还提出了DAMO-YOLO-Ns/Nm/Nl轻量级模型。它们在COCO上的性能分别为32.3/38.2/40.5 mAPs，对应于X86-CPU上的延迟为4.08/5.05/6.69 ms。我们提出的通用和轻量级模型在各自的应用场景中表现优越，超过了其他YOLO系列模型。

了解本专栏