CoAtNet简记

最新推荐文章于 2023-12-02 15:50:54 发布

椰子奶糖

最新推荐文章于 2023-12-02 15:50:54 发布

阅读量340

点赞数

分类专栏： # 论文阅读杂记文章标签： transformer 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/symuamua/article/details/124849726

版权

论文阅读杂记专栏收录该内容

51 篇文章 1 订阅

订阅专栏

CoAtNet简记

文章目录

- - CoAtNet简记

参考

简记

本文讲述了如何连接Conv&Self-Att这两个结构
- 二者的优缺点：
- Conv的平移不变性和Self-Att的全局视野自不必多说
- 第二点输入自适应权重我的理解是权重会随着输入的不同而有所不同，就是理解成不管输入是什么Conv的权重永远固定在Kernel中，而Self-Att的权重KQV会随着输入的变化而改变（虽然是因为经过了一次FC～）
以及如何堆叠这玩意

融合

DWConv表达式：
Self-Att的表达式：
其中求和符号下的L表示local，G表示global，下面是融合的方案
首先会发现DWConv与Self-Att表达式的形式具有一定的相似性，除了中间这一大坨，就是求和符号下的感受野不同
- 将卷积的感受野变成全局，即L->G
然后合并同类项（简单相加）
- 然后根据softmax的先后分成公式3左右两部分（post表示在softmax之后想加，pre则表示之前）

如何堆叠？

被Pass的方案：
- Self-Att替换成线性的Att，虽然计算量下降但是性能不太行
- 全局感受野变成局部感受野，由于是在TPU上跑的，这样速度太慢（TPU可以说是为Transformer而设计的专用芯片）
- 下采样之后用全局感受野
  - 像ViT一次性采样16倍
  - 多次采样，有下面的方案，C=Conv+下采样，T表示Transformer
    - CCCC、CCCT、CCTT、CTTT
    - 泛化能力排名：
    - 模型性能排名：

实验部分

实验部分可参考

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
CoAtNet简记

CoAtNet简记文章目录CoAtNet简记参考简记融合如何堆叠？实验部分参考原文实验部分可参考简记本文讲述了如何连接Conv&Self-Att这两个结构二者的优缺点：Conv的平移不变性和Self-Att的全局视野自不必多说第二点输入自适应权重我的理解是权重会随着输入的不同而有所不同，就是理解成不管输入是什么Conv的权重永远固定在Kernel中，而Self-Att的权重KQV会随着输入的变化而改变（虽然是因为经过了一次FC～）以及如何堆叠这玩
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

椰子奶糖 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。