【论文】【NLP】Attention Is All Y ou Need(注意力是你所需要的)
【参考:[1706.03762] Attention Is All You Need】2017【参考:详解Transformer (Attention Is All You Need) - 知乎】Abstract主要的序列转换模型是基于复杂的循环或卷积神经网络,包括编码器和解码器。性能最好的模型还通过注意机制连接编码器和解码器。我们提出了一种新的简单网络架构——Transformer,它完全基于注意力机制,完全摒弃了递归和卷积。在两个机器翻译任务上的实验表明,这些模型在质量上更优,同时具有更强的并行性
复制链接