注意力机制(Attention)

注意力机制分类

包括软注意力机制(Soft Attention)和硬注意力机制(Hard Attention)。

  • 硬注意力机制指随机选择某个信息作为需要注意的目标,是一个随机过程,不方便用梯度反向传播计算。
  • 软注意力机制指在选择信息的时候,计算N个输入信息的加权平均,再输入到神经网络中计算,可以直接利用梯度方向传播进行计算;

注意力机制的计算

  1. 计算注意力得分(attention score)
    注意力打分模型,常见有:
    加性模型:
    其中W、U和v是可学习的网络参数,d是输入信息的维度。

  2. 计算注意力分布
    利用softmax对注意力得分进行转换到0-1;
    在这里插入图片描述

  3. 计算注意力值
    采用加权求和的方式对输入信息进行汇总,得到注意力值:
    在这里插入图片描述
    在这里插入图片描述

  • 7
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值