Transformer学习笔记

YaquePeng

已于 2023-06-25 09:49:46 修改

阅读量172

点赞数

文章标签： transformer 学习笔记

于 2023-06-06 09:43:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_20081893/article/details/131060934

版权

The Illustrated Transformer – Jay Alammar – Visualizing machine learning one concept at a time. (jalammar.github.io)

上面是图片出处，是否是其原创不敢保证。我这不记录公式。专供小白看，谢谢。

发现csdn复制过来的图片居然不是动图。。。，直接看原文吧

第一步，把里面看成黑盒子，一步到位，移步最后一张动图。

第二步，知道里面是编码解码

第三步，里面的编码解码数量随便调整，论文说用的6层，数据逻辑如图，最后一个编码把数据传给解码了

第四步，来看看里面，没事晕了没关系，慢慢去查公式把，事实上pytorch等许多框架transformer的编码和解码都不需要你去写代码了，直接定义说要几个编码器，几个解码器就好了。下图是两个编码器两个解码器的结构。

第五步，来看看数据执行流程。下一张是动图

第六步，接着上面来的，吐槽一下，国内很多教程，为什么就只放上面那张呢，这一张动图直接明悟啊。另外感觉如果直接一个完整动图可能效果更直观。

最后，什么公式一个没有，就是没有哈哈，需要看公式的去别家吧，主打一个了解流程，有个这个，我相信你看代码完全没问题了。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Transformer学习笔记

transformer的学习笔记
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。