【VI Transformer】Self-attention中QKV的含义-学习记录

这是一个Self-Attention的公式,在查阅视频和文章之后,得到一些总结方便自己查看。

来自:http://【在线激情讲解transformer&Attention注意力机制(上)】 https://www.bilibili.com/video/BV1y44y1e7FW/?share_source=copy_web&vd_source=2ddee0d0a90d5f492e8f6db01a2d7569

套用视频中的截图。

(1)X是向量,W是通过学习到的矩阵,W和X相乘则代表线性相乘,提升拟合能力。
(2)套用视频中的例子,Q代表渣男的择偶要求,K代表自身条件,V代表被匹配到的备胎,每一个人都有自己的一套QKV。

(3)Q和K的转置相乘即为Q的行 与 K的矩阵的每一行进行点乘。 点乘的意义在于:

A\cdot B = \left | A \right |\cdot \left | B \right | \cos \Theta ,如A,B的角度为90度,则A,B没有相似性,角度越小,相似度越高。

因此Q 与 K的转置相乘 就是在计算Q的每一行与 K的每一行的相似度,就是渣男在与每一个备胎进行匹配,看看自己的关注度最应该放在谁身上。

(4)经过softmax之后即得到一个和为1的权重矩阵,接下来再与V(每一个值)进行加权,就可以得到最后的注意力分数。

  • 6
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值