【深度学习】Transformer原理篇——浓缩的精华
目录文章目录目录0. 前言1. 认识Transformer1.1 Seq2Seq模型与Attention机制1.2 Transformer1.2.1 Transformer基本结构1.2.2 Transformer的注意力机制1.2.3 Transformer的位置编码2. Transformer的应用探索2.1 NLP2.2 CV参考0. 前言Transformer由Google在《Attention Is All You Need》这篇论文中被提出,主要用于处理Seq2Seq(序列到序列,Sequ
原创
2021-06-08 20:03:37 ·
1692 阅读 ·
1 评论