- 博客(1)
- 收藏
- 关注
原创 详解Transformer
Transformer模型,核心于机器翻译任务,基于自注意力机制。它首先利用查询、键和值的矩阵形式来计算权重,进一步生成词的上下文相关表示。本文详细介绍了Transformer的Self-Attention机制和模型架构,并介绍了使用Transformer训练翻译模型的流程。
2023-09-21 16:41:42 769 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
Transformer模型,核心于机器翻译任务,基于自注意力机制。它首先利用查询、键和值的矩阵形式来计算权重,进一步生成词的上下文相关表示。本文详细介绍了Transformer的Self-Attention机制和模型架构,并介绍了使用Transformer训练翻译模型的流程。
2023-09-21 16:41:42 769 1
TA创建的收藏夹 TA关注的收藏夹
TA关注的人