自注意力机制

最新推荐文章于 2023-12-31 19:21:09 发布

失业

最新推荐文章于 2023-12-31 19:21:09 发布

阅读量478

点赞数

文章标签：自注意力机制

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51162561/article/details/133277126

版权

回顾以下注意力机制：
在这里插入图片描述

自注意力机制

Self-Attention的关键点在于
K $\approx$ V $\approx$ Q 来源于同一个X，三者是同源的，通过 $W_Q$ , $W_K$ , $W_V$ 做了一层线性变换。
接下来步骤和注意力机制一模一样。
在这里插入图片描述

$z_1$ 就是 thinking 的新的向量表示
对于thinking，初始词向量 $x_1$
现在我通过thinking machines这句话去查询这句话里的每一个单词和thinking之间的相似度
新的 $z_1$ 依然是thinking的词向量表示，只不过这个词向量表示蕴含了thinking machines这句话对于thinking而言哪个更重要的信息。
在这里插入图片描述
不仅规定了QKV同源，还规定了做法。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
自注意力机制

依然是thinking的词向量表示，只不过这个词向量表示蕴含了thinking machines这句话对于thinking而言哪个更重要的信息。现在我通过thinking machines这句话去查询这句话里的每一个单词和thinking之间的相似度。Self-Attention的关键点在于。就是 thinking 的新的向量表示。不仅规定了QKV同源，还规定了做法。接下来步骤和注意力机制一模一样。对于thinking，初始词向量。
复制链接

扫一扫

失业 CSDN认证博客专家 CSDN认证企业博客

码龄4年

91: 原创

30万+: 周排名

3万+: 总排名

1万+: 访问

: 等级

973: 积分

23: 粉丝

42: 获赞

20: 评论

37: 收藏

私信

关注

热门文章

最新评论

LeetCode：343. 整数拆分
CSDN-Ada助手: 算法技能树或许可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
MYDB项目启动教程
不给ní糖糖吃: 连接数据库的命令少了一对单引号
硕士应聘大专老师
学术菜鸟小晨: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰，图文并茂，详略得当，三连支持，期待博主持续输出好文!
判断推理 -- 图形推理 -- 属性规律
bjhdj: 大佬写的很好，mark一下，以后学习
接雨水（双指针法）
CSDN-Ada助手: 恭喜你写了第四篇博客！标题“接雨水（双指针法）”听起来非常有趣。我很高兴看到你持续创作，并分享了这个有趣的主题。双指针法是一个很有用的技巧，我期待着你能够进一步展开这个话题。接下来，我建议你考虑在博客中加入一些实例或案例研究，以帮助读者更好地理解双指针法在接雨水问题中的应用。例如，你可以分享一些具体的算法步骤或者解决实际问题时的思考过程。这样，读者可以更好地从你的博客中获得实用的知识和技巧。期待看到你下一篇博客的精彩内容！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。