self-attention学习笔记

自己学习使用

写的非常nb的讲解超详细图解Self-Attention - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/410776234

李宏毅视频讲解

​​​​​​视频链接https://search.bilibili.com/all?vt=95458974&keyword=%E6%9D%8E%E5%AE%8F%E6%AF%85&from_source=webtop_search&spm_id_from=333.999

两个向量相关联的程度

计算出attention score 

 使用softmax

 

 b1,b2,b3,b4可以同时被计算出来

在矩阵方方面的处理

 
转置后进行相乘

计算b

只有红色框框的需要训练得到

 多头之间互相不影响,只在各自的层做矩阵运算

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值