自注意力与卷积高效融合！多SOTA、兼顾低成本与高性能

深度之眼

于 2024-06-18 18:16:17 发布

阅读量865

点赞数 6

分类专栏：人工智能干货深度学习干货文章标签：人工智能深度学习 transformer 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42645636/article/details/139780544

版权

在自注意力机制中，模型计算输入序列中不同位置的相关性得分，以生成连接权重，从而关注序列中的重要部分。而卷积通过滑动窗口的方式，在输入上应用相同权重矩阵来提取局部特征。

如果将以上两者结合，就可以同时利用自注意力捕捉长距离依赖关系和卷积运算提取局部特征的能力，让模型更全面地理解输入数据（特别是在处理复杂任务时），实现更高的性能和更低的计算成本。比如典型案例X-volution与ACmix。

目前这种结合策略的高质量成果已有不少，我从中整理了10个比较有代表性的供同学们参考，原文以及开源代码都整理好了，希望能给各位的论文添砖加瓦。

论文原文以及开源代码需要的同学看文末

X-volution: On the unification of convolution and self-attention

方法：本文提出了一种新的原子操作符X-volution，将卷积和自注意力操作符集成在一起，通过实验证明了它在图像分类、目标检测和实例分割等任务上取得了显著的性能改进。

创新点：

提出了X-volution原子操作符&

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。