YOLOv10改进 | 注意力篇 | YOLOv10引入24年最新Mamba注意力机制MLLAttention

1. MLLAttention介绍

1.1  摘要: Mamba 是一种有效的状态空间模型,具有线性计算复杂度。 最近,它在处理各种视觉任务的高分辨率输入方面表现出了令人印象深刻的效率。 在本文中,我们揭示了强大的 Mamba 模型与线性注意力 Transformer 具有惊人的相似之处,而线性注意力 Transformer 在实践中通常表现不佳。 通过探索有效的 Mamba 和低于标准的线性注意力 Transformer 之间的异同,我们提供全面的分析来揭开 Mamba 成功背后的关键因素。 具体来说,我们在统一的公式中重新表述了选择性状态空间模型和线性注意力,将 Mamba 重新表述为线性注意力 Transformer 的变体,具有六个主要区别:输入门、忘记门、捷径、无注意力归一化、单头和修改块 设计。 对于每个设计,我们都会仔细分析其优缺点,并凭经验评估其对视觉任务中模型性能的影响。 有趣的是,结果强调了遗忘门和区块设计是 Mamba 成功的核心贡献者,而其他四种设计则不太重要。 基于这些发现,我们通过将这两个关键设计的优点融入到线性注意力中,提出了类曼巴线性注意力(MLLA)模型。 所得模型在图像分类和高分辨率密集预测任务中均优于各种视觉 Mamba 模型,同时享有可并行计算和快速推理速度。

官方论文地址:https://arxiv.org/pdf/2405.1660

  • 49
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值