作者:禅与计算机程序设计艺术 1.简介 Attention Is All You Need (A-Transformer)是一种全新的自注意力机制的网络结构,其特点在于将计算复杂度从 O ( N 2 ) O(N^2) O(N