【阅读笔记】HOW DO VISION TRANSFORMERS WORK?

西西弗斯42

已于 2022-02-22 16:21:33 修改

阅读量2.9k

点赞数

分类专栏：论文阅读文章标签：深度学习计算机视觉神经网络

于 2022-02-22 16:20:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/life__saver/article/details/123067544

版权

原论文地址：https://arxiv.org/abs/2202.06709

目录

1.1 Realted Work

1.2 Contribution

Abstract

论文围绕三点展开：

1.MSA通过平缓神经网络的loss landscape提升准确度和泛化能力，这种能力来自于data specificity而不是long-range dependency(联系两个较远pixel的关系)。

2.MSA是低通滤波器，Conv是高通滤波器，它们功能互补。

3.提出AlterNet，用MSA块代替一个stage结束时的conv块。

1.Introduction

        广泛的观点认为MSA的成功来自于弱归纳偏置(weak inductive bias)和长期依赖的捕捉(long-range dependency)，由于其over-flexibility特性，导致ViT在训练数据上过拟合。作者对此提出了反对意见。

1.1 Realted Work

        从CNN的角度看，MSA是一种特殊的卷积变换，它作用于所有的feature map points，具有large-sized和data-specific的特点。

        weak inductive bias真的对MSA的预测能力有所提升吗？作者认为适当的约束实际上可能有助于模型学习强表示，并举了local MSA成功的例子。

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
【阅读笔记】HOW DO VISION TRANSFORMERS WORK?

Abstract论文围绕三点展开：1.MSA通过平缓神经网络的loss landscape提升准确度和泛化能力，这种能力来自于data specificity而不是long-range dependency(联系两个较远pixel的关系)。2.MSA是低通滤波器，Conv是高通滤波器，它们功能互补。3.提出AlterNet，用MSA块代替一个stage结束时的conv块。1.Introduction广泛的观点认为MSA的成功来自于弱归纳偏置(weak induc...
复制链接

扫一扫

专栏目录

西西弗斯42 CSDN认证博客专家 CSDN认证企业博客

码龄7年

2: 原创

99万+: 周排名

153万+: 总排名

2万+: 访问

: 等级

38: 积分

0: 粉丝

13: 获赞

9: 评论

20: 收藏

私信

关注

分类专栏

论文阅读 1篇
Tips 1篇

最新评论

解决torchsummary报AttributeError: ‘xxx‘ object has no attribute ‘size‘错误
xiguasanhao: 安装了还是不行啊
解决torchsummary报AttributeError: ‘xxx‘ object has no attribute ‘size‘错误
林思少: 装了你说的包后，RuntimeError: Failed to run torchsummary. See above stack traces for more details. Executed layers up to: [Sequential: 2-1, Conv2d: 3-1, LayerNorm: 3-2, SequentialPolarizedSelfAttention: 3-3, Conv2d: 4-1, Conv2d: 4-2, Softmax: 4-3, Conv2d: 4-4, LayerNorm: 4-5, Sigmoid: 4-6, Conv2d: 4-7, Conv2d: 4-8, AdaptiveAvgPool2d: 4-9, Softmax: 4-10, Sigmoid: 4-11, Sequential: 2-2, ConvEncoder: 3-4, Conv2d: 4-12, LayerNorm: 4-13, Linear: 4-14, GELU: 4-15, Linear: 4-16, SequentialPolarizedSelfAttention: 4-17, Identity: 4-18, ConvEncoder: 3-5, Conv2d: 4-19, LayerNorm: 4-20, Linear: 4-21, GELU: 4-22, Linear: 4-23, SequentialPolarizedSelfAttention: 4-24, Identity: 4-25, ConvEncoder: 3-6, Conv2d: 4-26, LayerNorm: 4-27, Linear: 4-28, GELU: 4-29, Linear: 4-30, SequentialPolarizedSelfAttention: 4-31, Identity: 4-32, Sequential: 2-3, LayerNorm: 3-7, Conv2d: 3-8, ConvEncoder: 3-9, Conv2d: 4-33, LayerNorm: 4-34, Linear: 4-35, GELU: 4-36, Linear: 4-37, SequentialPolarizedSelfAttention: 4-38, Identity:
解决torchsummary报AttributeError: ‘xxx‘ object has no attribute ‘size‘错误
聪聪0620: 但是我发现柚有些层的参数显示不全呀
解决torchsummary报AttributeError: ‘xxx‘ object has no attribute ‘size‘错误
NaChuaN666: 使用命令： pip install torch-summary==1.4.4 即可解决
解决torchsummary报AttributeError: ‘xxx‘ object has no attribute ‘size‘错误
AriesLyue: 谢谢居然真的解决问题了

最新文章

解决torchsummary报AttributeError: ‘xxx‘ object has no attribute ‘size‘错误

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。