AI学习记录 - 自注意力机制之权重矩阵和查询向量V矩阵的计算方式的补充

点个赞

如果我们熟悉自注意力的话,就会发现Q和K矩阵结合的时候,会有一个长度为句子长度的权重矩阵,假如有句子abc,求abc的注意力权重矩阵的话,那就是一个3*3的矩阵如下矩阵。

在这里插入图片描述

我们假设了句子长度为3,那么V矩阵肯定也是宽为3,因为有三个词汇痲,长度为n的矩阵,假设n为5,每一行都是一个词向量。如下图
在这里插入图片描述

直接使用矩阵乘法将这两个矩阵相乘即可,得到一个形状一样的矩阵,这就是新的abc词向量。为什么使用矩阵乘法相乘就可以了呢,意义在哪里?

权重和V矩阵(词向量矩阵)的关系

1、只有a的时候,没有词汇对a造成影响,所以其他是负无穷大,类似我们看文章,我们对当前词的判断,来源于当前词的前面的词的影响,不考虑当前词的后面的词。

在这里插入图片描述

2.a和b存在的时候,a和b共同组成一个综合的语义,那a对综合语义影响大,还是b对综合语义影响大吗,为什么不叫b的新词向量,叫a和b的综合词向量呢?我认为,b的原语义,受到a语义的影响,那么b原语义就会被减弱,实际上是a和b的共同结果形成的新词向量,如下。

在这里插入图片描述

3.a和b,c存在的时候,a和b,c共同组成一个综合的语义,那a对综合语义影响大,还是b对综合语义影响大,还是c对综合语义影响大,如下。

在这里插入图片描述

得到下图 3 * 5 矩阵

在这里插入图片描述

刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚 好 矩阵乘法满足我们对于词汇权重和V词向量矩阵的算法定义。。。。。。。。。。。。。。。。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值