自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 3. Transformer —— 理解QKV

在这一篇中,我们重新认识了词向量,qkv以及他们的意义和作用。在此基础上,后续才能更好的理解decoder的工作原理。接下来,主要会讲解decoder结构和原理,transformer的总体结构,训练和预测流程。如果能找到合适的项目的话,会进行代码层面的学习演示。0.1*v1。

2024-04-17 17:05:47 2449 1

原创 2. Transformer基础学习--encoder模块

encoder基本模块的介绍,有多头自注意力,FFN,残差和归一化

2024-04-09 16:10:49 2030

原创 1.Transformer基础学习--attention理解

本系列对transformer各个模型进行讲解,本篇重点介绍attention

2024-04-08 21:57:23 1086 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除