- 博客(3)
- 收藏
- 关注
原创 3. Transformer —— 理解QKV
在这一篇中,我们重新认识了词向量,qkv以及他们的意义和作用。在此基础上,后续才能更好的理解decoder的工作原理。接下来,主要会讲解decoder结构和原理,transformer的总体结构,训练和预测流程。如果能找到合适的项目的话,会进行代码层面的学习演示。0.1*v1。
2024-04-17 17:05:47 2448 1
原创 1.Transformer基础学习--attention理解
本系列对transformer各个模型进行讲解,本篇重点介绍attention
2024-04-08 21:57:23 1086 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人