EMA：基于跨空间学习的高效多尺度注意力模块

AI浩

已于 2023-07-01 06:53:59 修改

阅读量1.7w

点赞数 7

分类专栏：高质量人类CV论文翻译文章标签：学习深度学习神经网络

于 2023-06-23 17:21:54 首次发布

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/hhhhhhhhhhwwwwwwwwww/article/details/131347981

版权

高质量人类CV论文翻译专栏收录该内容

122 篇文章 166 订阅 ¥79.90 ¥99.00

订阅专栏

论文提出了一种新的高效多尺度注意力(EMA)模块，用于计算机视觉任务，包括图像分类和目标检测。EMA模块在不降低通道维度的情况下，通过跨空间学习融合两个并行子网络的输出特征，捕捉像素级成对关系，避免了传统方法的计算开销。实验证明，EMA在CIFAR-100、ImageNet-1k、MS COCO和VisDrone2019上表现出优于现有注意力机制的性能，并在参数效率方面更优。

摘要由CSDN通过智能技术生成

文章目录

摘要
1、简介
2、相关工作
3、高效多尺度注意力机制
- 3.1、回顾坐标注意力(CA)
- 3.2、多尺度注意力(EMA)模块
4、实验
5、消融实验
6、结论

在这里插入图片描述

摘要

https://arxiv.org/ftp/arxiv/papers/2305/2305.13563.pdf

在各种计算机视觉任务中，通道或空间注意力机制在产生更清晰的特征表示方面的显著有效性得到了证明。然而，通过通道降维来建模跨通道关系可能会给提取深度视觉表示带来副作用。提出了一种新的高效的多尺度注意力(EMA)模块。以保留每个通道上的信息和降低计算开销为目标，将部分通道重塑为批量维度，并将通道维度分组为多个子特征，使空间语义特征在每个特征组中均匀分布。具体来说，除了对全局信息进行编码以重新校准每个并行分支中的通道权重外，还通过跨维度交互进一步聚合两个并行分支的输出特征，以捕获像素级成对关系。对图像分类和目标检测任务进行了广泛的消融研究和实验，使用流行的基准(如CIFAR-100、ImageNet-1k、MS COCO和VisDrone2019)来评估其性能。代码可以在https://github.com/YOLOonMe/EMAattention-module上找到。

1、简介

随着深度卷积神经网络(Convolutional Neural Networks, CNNs)的发展，其网络拓扑结构在图像分类和目标检测等领域

了解本专栏

关注

7
点赞
踩
42

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AI浩 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。