上面是图片出处,是否是其原创不敢保证。我这不记录公式。专供小白看,谢谢。
发现csdn复制过来的图片居然不是动图。。。,直接看原文吧
第一步,把里面看成黑盒子 ,一步到位,移步最后一张动图。
第二步,知道里面是编码解码
第三步,里面的编码解码数量随便调整,论文说用的6层,数据逻辑如图,最后一个编码把数据传给解码了
第四步,来看看里面,没事晕了没关系,慢慢去查公式把,事实上pytorch等许多框架transformer的编码和解码都不需要你去写代码了,直接定义说要几个编码器,几个解码器就好了。下图是两个编码器两个解码器的结构。