Transformer学习笔记

The Illustrated Transformer – Jay Alammar – Visualizing machine learning one concept at a time. (jalammar.github.io)

上面是图片出处,是否是其原创不敢保证。我这不记录公式。专供小白看,谢谢。

发现csdn复制过来的图片居然不是动图。。。,直接看原文吧

第一步,把里面看成黑盒子 ,一步到位,移步最后一张动图。

 第二步,知道里面是编码解码

第三步,里面的编码解码数量随便调整,论文说用的6层,数据逻辑如图,最后一个编码把数据传给解码了 

第四步,来看看里面,没事晕了没关系,慢慢去查公式把,事实上pytorch等许多框架transformer的编码和解码都不需要你去写代码了,直接定义说要几个编码器,几个解码器就好了。下图是两个编码器两个解码器的结构。 

 

 第五步,来看看数据执行流程。下一张是动图

 第六步,接着上面来的,吐槽一下,国内很多教程,为什么就只放上面那张呢,这一张动图直接明悟啊。另外感觉如果直接一个完整动图可能效果更直观。

 最后,什么公式一个没有,就是没有哈哈,需要看公式的去别家吧,主打一个了解流程,有个这个,我相信你看代码完全没问题了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值