注意力机制（Attention mechanism）

PL_涵

已于 2022-11-03 10:23:04 修改

阅读量1.6k

点赞数 2

分类专栏：【入门学习DL】文章标签：深度学习

于 2022-07-08 17:11:40 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/PL_hfc/article/details/125681385

版权

【入门学习DL】专栏收录该内容

7 篇文章 0 订阅

订阅专栏

自注意力机制（self-attention）

首先，其核心思想为：

$Attention(Q,K,V)=softmax(\frac{QK^{T}}{\sqrt{d_{k}}})V$

其中，Q为query， $Q=W^{Q}X$ ，即查询、要查询的信息

K为key， $K=W^{K}X$ ，即索引、被查询的向量

V为value， $V=W^{V}X$ ，即值、查询到的内容

dk代表k的维度，除以k的维度的平方根，使训练时的梯度保持稳定

Q，K，V都是输入x经过经过线性变换得到的，和它们分别相乘的三个矩阵W是通过学习得到的矩阵，使用这样的线性变换可以提高的模型的拟合能力

举一个例子

有一个渣男，他有 n 个备胎，他想要从自己的备胎里寻找最符合自己期望的，好分配注意力和管理时间

用 Q 表示择偶标准，K表示自身条件，V表示被匹配到的备胎

所以不论是渣男，还是备胎，都有着自己的一套Q，K，V

那么，当渣男开始筛选备胎时，肯定是备胎条件与渣男的择偶标准相符合时比较好，也就是备胎的 K 与渣男的 Q 相似度更高时

对于两个向量点乘的几何意义：向量A与向量B的点乘，也就是A在B向量上的投影，所以点乘的大小可以表示A与B向量的相似度。当两个向量垂直时，我们知道它们点乘的结果为0，说明这两个向量没有一点相关性，所以同样，当两个向量点乘的结果越大时，说明两个向量的相似度就越高

再看向 $QK^{T}$ ，矩阵Q与矩阵K的转置相乘，相当于Q的每一行和K的每一行进行点乘，也就是每个行向量的相似度，然后使用 $softmax$ 函数对结果进行归一化，也就是让所有元素的和为1，我们就得到了一个权重矩阵，接下来用得到的权重矩阵给匹配到的备胎加权，也就是将权重矩阵与V相乘，渣男就知道该对每个备胎付出多少注意力了

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
注意力机制（Attention mechanism）

自注意力机制（self-attention）首先，其核心思想为：其中，Q为query，，即查询、要查询的信息K为key，，即索引、被查询的向量V为value，，即值、查询到的内容dk代表k的维度，除以k的维度的平方根，使训练时的梯度保持稳定 Q，K，V都是输入x经过经过线性变换得到的，和它们分别相乘的三个矩阵W是通过学习得到的矩阵，使用这样的线性变换可以提高的模型的拟合能力举一个例子有一个渣男，他有 n 个备胎，他想要从自己的备胎里寻找最符合自己期望的，好分配注意力和管理时间用 Q 表示择偶标准，K
复制链接

扫一扫

专栏目录

PL_涵 CSDN认证博客专家 CSDN认证企业博客

码龄3年

41: 原创

134万+: 周排名

14万+: 总排名

2万+: 访问

: 等级

332: 积分

15: 粉丝

51: 获赞

1: 评论

85: 收藏

私信

关注

热门文章

分类专栏

最新评论

Communication Systems
CSDN-Ada助手: 算法技能树或许可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
机器学习第三周（正规方程——一步求参）
CSDN-Ada助手: 非常棒的博客内容！继续坚持下去，写出更多优质的技术文章吧！如果你想继续深入探讨机器学习领域，不妨考虑写一篇关于随机梯度下降算法的博客，介绍其原理、实现方式及在机器学习中的应用等方面，相信会对很多读者有所帮助。期待你的下一篇精彩内容！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

PL_涵 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。