ACmix：卷积与self-Attention的融合

社区小铁匠

已于 2022-07-22 10:55:50 修改

阅读量6.1k

点赞数 8

分类专栏：小铁匠每月小读文章标签： transformer 深度学习人工智能计算机视觉 python

于 2022-07-18 22:09:34 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tiehanhanzainal/article/details/125858912

版权

先附代码和文章，可以先结合来看

代码：GitHub - LeapLabTHU/ACmix: Official repository of ACmix (CVPR2022)

文章：[2111.14556] On the Integration of Self-Attention and Convolution (arxiv.org)

ACmix是卷积网络和transformer两种强大的网络优势的集合，具有较低的计算开销，同时也能提升网络性能，在卷积网络和transformer各行其是的今天，是一种融合两种优势的不错方法。

这篇文章此次先介绍下ACmix的结构和代码，该结构的具体应用有时间更新。

首先，该作者认为一个kxk卷积可以看做是由kxk个1x1卷积的拼接构成的，而transformer中的线性层也可以看做是一个1x1的卷积，这是这篇文章成立的前提。

其次，作者在此基础上探索将两者的优势结合，提出如下图所示的结构，在两者都是由1x1卷积构成的前提下，将1x1卷积进行不同的组合构成卷积或者self-Attention，再将两种结构并行连接。

首先卷积部分，当一个3x3卷积滑过一张图时，可分为两阶段，第一阶段是采用9个1x1卷积分别对图片做卷积操作，第二阶段是将得到的9个特征图按照一定的方式排列求和。例如，3x3卷积核的左上角的点不能与图片右上角像素点做乘积，而图片左上角像素点只与卷积核左上角权重相乘，则相应位置的1x1卷积应该往左上方偏移一个像素同时舍弃掉最右列与最下排的像素点，同理，可分析出9个1x1卷积的排列方式如下图所示：

最低0.47元/天解锁文章

社区小铁匠

博客等级

码龄3年

3
原创

11
点赞

97
收藏

7
粉丝

关注

私信

热门文章

分类专栏

小铁匠每月小读 3篇

最新评论

Swin_Transformer_minivit代码解读
Yinc_Lin: 关注了，坐等更新
ACmix：卷积与self-Attention的融合
m0_53365111: 博主您好我想问一下用acmix模块后训练完后运行test.py出现RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cpu and cuda:0! (when checking argument for argument weight in method wrapper___slow_conv2d_forward) 这个问题您能指导一下吗？
ACmix：卷积与self-Attention的融合
社区小铁匠: 这个结构想通过1x1卷积实现卷积核self-attention的结合，你比较的时候可以和两个参数量的和进行比较才比较公平。但是我在实际试验过程中感觉并不是很好
ACmix：卷积与self-Attention的融合
嘿嘿jisks: 楼主我看你也说了相应计算量也比较大，那这不是跟文章表述的背道而驰了吗？我现在也挺迷糊的。我自己测试了一下用nn.Conv2d(16, 64, 1)，输入大小是(1, 16, 224, 224)，这个参数量只有1088，但是如果用ACmix得到的参数量是8604，这差了快8倍了，但是文章说 “同时与纯卷积或self-attention相比具有最小的计算开销”，好像没有体现，这是咋回事啊
ACmix：卷积与self-Attention的融合
One_self_: 仅从ACMix这个类来看，就是把q,k,v他们原本的@矩阵乘法改成了各种位置对应相乘的*，以及一些其他的处理，跟conv2former有点相似，但conv2former我用在yolov5里跑tt100k数据集没有效果

最新文章

目录

评论 15

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。