总体结构
encoder和decoder分别利用6个encoder和decoder组成,简化结构表示如下:
每个encoder和decoder的简化结构如下所示:
处理流程:首先对输入的数据进行一个embedding操作,embedding结束之后将结果输入到encoder层,self-attention处理完数据将结果送给前馈神经网络,得到的输出结果会输入到下一层encoder;
encoder
encoder是由N=6个相同的layer组成,layer指的是上图左侧的单元,最左边有个"Nx",这里的x是6,每个layer由两个sub-layer组成,分别是multi-head self-att