参考 推荐! (1)self attention 解释推荐! (2)key-query-value 解释推荐! (3)multi-head attention 解释推荐! (4)Transformer 解释Transformer为何能闯入CV界秒杀CNNTransformer英文介绍 The Illustrated Transformer详解Transformer-知乎基础attention 直观说明基础attention 公式解释Transformer网络详解