免费链接: Blogger(需翻Q)
文章目录
本文内容
Transformer是个相对复杂的模型,可能有些人和我一样,学了也不会用,或者感觉自己懂了,但又不懂。本文将Transformer看做一个黑盒,然后讲解Pytorch中nn.Transformer的使用。
本文包含内容如下:
- Transformer的训练过程讲解
- Transformer的推理过程讲解
- Transformer的入参和出参讲解
- nn.Transformer的各个参数讲解
- nn.Transformer的mask机制详解
- 实战:使用nn.Transformer训练一个copy任务。
你可以在该项目找到本文的源码
开始之前,我们先导入要用到的包:
import math
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



