论文阅读（四）Vision Transformer ViT学习

最新推荐文章于 2024-09-26 16:58:09 发布

Ray Song

最新推荐文章于 2024-09-26 16:58:09 发布

阅读量1.5k

点赞数

分类专栏： 7. 论文阅读文章标签： transformer 计算机视觉深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/rayso9898/article/details/122348945

版权

7. 论文阅读专栏收录该内容

5 篇文章 0 订阅

订阅专栏

视频：

ViT论文逐段精读【论文精读】
https://www.bilibili.com/video/BV15P4y137jb?t=1.7

专栏笔记
https://www.bilibili.com/read/cv14221668?from=note

不敢相信，昨天晚上通宵把ViT和MAE的论文精读看完了，B站评论区的大佬们太多了，笔记总结的很可以，就直接屯着了。
这几天看论文精读视频还是蛮有用的，论文写作思路、不同写作方式的优缺点，基本上已经能够独立判断了。
还有就是，最近看的论文好贵呀，比如MAE,作者说耗费资源很少，尽管如此，一篇论文跑的实验要耗费几十万美元？？贫穷限制了我的想像。

论文链接：
An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale
https://arxiv.org/abs/2010.11929

github链接：
https://github.com/google-research/vision_transformer

来张ViT的框架图
在这里插入图片描述

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Ray Song 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。