【深度学习】注意力机制

概述

卷积、全连接、池化层都只考虑不随意线索

注意力机制则显示的考虑随意线索

随意:跟随意志(主观),有想法的选择

  • 随意线索被称之为查询(query)
  • 每个输入是一个值(value)和不随意线索(key)的对
  • 通过注意力池化层来有偏向性的选择选择某些输入

会根据query寻找感兴趣的东西

非参注意力池化层

  • 给定数据\left ( x_{i},y_{i} \right ),i=1,...,n
  • 查询x,平均池化是最简单的方案,不管具体查询直接对y平均,f\left ( x \right )=\frac{1}{n}\sum_{i}^{}y_{i}

更好的方案是60年代提出来的Nadaraya-Watson核回归(会跟候选相减,加权再对y求和。选择跟查询x相近的yi进行求和)

 

参数化的注意力机制

  •  如果使用高斯核函数

  • 代入,则

 

 在之前基础上引入可以学习的w,x是查询,xi yi是数据,均不可以学习。

 所以,注意力机制可以一般写作

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值