Transformer 详解

最新推荐文章于 2023-09-14 14:17:52 发布

Decennie

最新推荐文章于 2023-09-14 14:17:52 发布

阅读量150

点赞数

分类专栏： NLP

原文链接：https://wmathor.com/index.php/archives/1438/

版权

NLP 专栏收录该内容

11 篇文章 12 订阅

订阅专栏

本文详细介绍了Transformer模型的encoder部分，其输入为X，输出为Xhidden，是一个三维向量。Encoder通过自注意力机制，利用所有单词的表示进行加权求和，权重由点积 softmax 得到。同时，文章也探讨了Decoder的工作原理以及整个训练过程的输入输出流程。

摘要由CSDN通过智能技术生成

Transformer 详解(encoder)

若encoder的输入为 $\in R^{batch\_size \space \times \space sequence\_len}$ ,则encoder的输出是是个向量， $X_{hidden} \in R^{batch \_ size \space \times \space sequence \_ len\space \times \space embedding \_ dim}$

Transformer 详解(decoder以及训练过程的输入输出等问题)

自注意力的另一种解释就是在编码某个单词时，就是将所有单词的表示（值向量）进行加权求和，而权重是通过该词的表示（键向量）与被编码词表示（查询向量）的点积并通过softmax得到

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Decennie CSDN认证博客专家 CSDN认证企业博客

码龄3年

79: 原创

30万+: 周排名

187万+: 总排名

28万+: 访问

: 等级

1282: 积分

27: 粉丝

198: 获赞

28: 评论

1115: 收藏

私信

关注

热门文章

分类专栏

数据库 4篇
CSS 5篇
Python 30篇
Linux 1篇
Vue 2篇
Begin 4篇
Javascript 3篇
Pytorch 48篇
NLP 11篇
Deep Learning 3篇
Numpy
Re 2篇

最新评论

K-Bert 详解
lyconghk: 谢谢博主，让我看懂了论文可见矩阵的定义，之前搞不懂句子树中的两个单词什么时候可见，现在看懂了
关系模型中的三类完整性约束：实体完整性、参照完整性和用户定义完整性
qq_73770977: 关系中的“主属性”不允许取空值的约束规则是实体完整性约束。实体完整性约束用于确保关系中的每条记录都具有唯一的标识，即主键属性的值不能为空且唯一。数据库管理系统会在插入和更新数据时进行检查，以防止违反实体完整性约束。若属性S是关系中的主键，则属性S中的属性值不能为空值。因此，主属性作为主键的一部分，同样不能取空值。简而言之，实体完整性约束就是针对基本关系而言的，它规定了主属性（主键）不能取空值，从而确保每个记录都是唯一且可区分的。大模型3.5生成
Overleaf 指南：30 分钟 LaTeX 入门
m0_60769031: 怎么输入音标
SRL(Semantic Role Labelling): 语义角色标注
书生与鹿、: 请问你做了吗，急
超码、候选码、主码、主属性、非主属性
weixin_43128949: 另外，如果性别和姓名可以唯一标识一个学生，则{姓名，性别}也为超码。这句话是不是写错了

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。