Gold-YOLO: 基于集散机制的高效目标检测器

本文介绍了一种新型的实时目标检测器Gold-YOLO,通过GD机制增强特征融合,实现延迟和准确性间的平衡。Gold-YOLO在COCOval2017上表现出色,优于YOLOv6-3.0-N。研究还探讨了全局信息融合和轻量级邻接层融合模块对模型性能的影响。
摘要由CSDN通过智能技术生成

github:https://github.com/huawei-noah/EfficientComputing/tree/master/Detection/Gold-YOLO

Gold-YOLO模型是一种全新的实时目标检测器,其优点主要包括:

  1. 提高了多尺度特征融合能力:Gold-YOLO通过使用先进的Gather-and-Distribute(GD)机制,实现了多尺度特征的融合,从而提高了检测器的性能。
  2. 实现了延迟和准确性之间的理想平衡:在所有模型尺度上,Gold-YOLO都实现了延迟和准确性的理想平衡,这意味着它可以在保持高准确率的同时,实现快速的检测速度。

摘要:

在过去的几年里,YOLO 系列模型已经成为实时目标检测领域的主导方法。许多研究通过修改体系结构、增加数据和设计新的损失将基线提升到更高的水平。尽管特征金字塔网络(FPN)和路径聚合网络(PANet)已经缓解了这一问题,但是我们发现以往的模型仍然存在信息融合问题。因此,本研究提供了一个先进的集散机制(GD) ,它是通过卷积和自我注意操作来实现的。这种新设计的模型被命名为 Gold-YOLO,它提高了多尺度特征融合能力,并在所有模型尺度上实现了延迟和准确性之间的理想平衡。此外,我们首次在 YOLO 系列中实现了 MAE 风格的预训练,允许 YOLO 系列模型可以从无监督的预训练中受益。Gold-YOLO-N 在 COCO val2017数据集上获得了出色的39.9% AP,在 T4图形处理器上获得了1030 FPS,其表现优于以前的 SOTA 型 YOLOv6-3.0-N,具有类似的 FPS + 2.4% 。

方法:

TopFormer基于全局信息融合的思想,在语义分割任务中取得了显著的效果。本文在TopFormer的理论基础上,通过全局融合多层次特征并将全局信息注入到更高层次,提出了一种新颖的GD (gathering -and- distributed mechanism)机制来实现yolo中高效的信息交换。这显著增强了颈部的信息融合能力,而不会显著增加延迟,提高了模型在不同对象大小之间的性能。GD机制包括两个分支:浅层收集-分发分支和深层收集-分发分支,分别通过基于卷积的块和基于注意力的块提取和融合特征信息。为了进一步促进信息流,引入了一个轻量级的邻接层融合模块,在局部尺度上结合相邻层的特征。Gold-YOLO架构超过了现有的YOLO系列,有效地证明了所提出方法的有效性。

  • 9
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CV缝合怪

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值