【YOLOv10改进- 特征融合】 YOGA iAFF ：注意力机制在颈部的多尺度特征融合

YOLO大师

已于 2024-07-20 10:41:57 修改

阅读量922

点赞数 23

分类专栏： YOLOv10 创新改进文章标签： YOLO 论文阅读目标检测人工智能 yolov10

于 2024-06-29 22:23:34 首次发布

原创文章，禁止任何形式转载！

本文链接：https://blog.csdn.net/shangyanaf/article/details/140071712

版权

YOLOv10 创新改进专栏收录该内容

该专栏为热销专栏榜第74名

66 篇文章 8 订阅 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

YOLOv10目标检测创新改进与实战案例专栏

改进目录: YOLOv10有效改进系列及项目实战目录：卷积，主干注意力，检测头等创新机制

专栏链接: YOLOv10 创新改进有效涨点

介绍

摘要

我们推出 YOGA，这是一种基于深度学习的轻量级目标检测模型，可以在低端边缘设备上运行，同时仍能实现有竞争力的准确性。 YOGA 架构由一个具有廉价线性变换的两阶段特征学习管道组成，它仅使用传统卷积神经网络所需的一半卷积滤波器来学习特征图。此外，它使用注意力机制在颈部执行多尺度特征融合，而不是传统检测器使用的朴素串联。 YOGA 是一种灵活的模型，可以轻松地放大或缩小几个数量级，以适应广泛的硬件限制。我们使用 10 多个最先进的目标检测器在 COCO-val 和 COCO-testdev 数据集上评估 YOGA。结果表明，YOGA 在模型大小和精度之间取得了最佳权衡（AP 提高了 22%，参数和 FLOP 减少了 23-34%），使其成为低端野外部署的理想选择边缘设备。我们在 NVIDIA Jetson Nano 上的硬件实现和评估进一步证实了这一点。

文章链接

论文地址：论文地址

代码地址：代码地址

基本原理

YOGA是一种基于深度学习的轻量级目标检测模型，旨在在低端边缘设备上运行，同时实现竞争性的准确性。YOGA架构包括一个两阶段特征学习流水线，其中使用廉价的线性转换学习特征图，仅需传统卷积神经网络所需卷积滤波器数量的一半。此外，它在其"neck"部分使用了一种注意力机制进行多尺度特征融合，而不是传统检测器所使用的简单串联。YOGA是一个灵活的模型，可以轻松地按数量级适应各种硬件约束。我们在COCO-val和COCO-testdev数据集上评估了YOGA，并与其他10多种最先进的目标检测器进行了比较。结果显示，YOGA在模型大小和准确性之间取得了最佳平衡（AP提高了高达22％，参数和FLOPs减少了23-34％），使其成为在低端边缘设备上部署的理想选择。