李宏毅transformer(学习记录)
在S2S任务中,主要就是input进入encoder,然后经过decoder得到输出transformer中的encoder结构,其作用就是输入一排向量,输出另一段向量,可以用self-attention,RNN,CNN模型完成、在transform中用的是attention下面是encoder结构,input经过一系列的block,最后得到另外一组向量,接下来是每个block的解析,以input为单独一个蓝色标签b为例,首先输入经过attention得到a,然...
复制链接