免费链接: Blogger(需翻Q)
文章目录
本文内容
Transformer是个相对复杂的模型,可能有些人和我一样,学了也不会用,或者感觉自己懂了,但又不懂。本文将Transformer看做一个黑盒,然后讲解Pytorch中nn.Transformer的使用。
本文包含内容如下:
- Transformer的训练过程讲解
- Transformer的推理过程讲解
- Transformer的入参和出参讲解
- nn.Transformer的各个参数讲解
- nn.Transformer的mask机制详解
- 实战:使用nn.Transformer训练一个copy任务。
你可以在该项目找到本文的源码
开始之前,我们先导入要用到的包:
import ma