注意力机制

Starry memory

已于 2023-05-17 01:06:46 修改

阅读量147

点赞数

分类专栏：深度学习文章标签：自然语言处理神经网络数据挖掘机器学习深度学习

于 2021-01-08 11:29:27 首次发布

本文链接：https://blog.csdn.net/doswynkfsw/article/details/112348897

版权

深度学习专栏收录该内容

16 篇文章 0 订阅

订阅专栏

https://blog.csdn.net/weixin_42398658/article/details/90804173
https://www.cnblogs.com/Luv-GEM/p/10712256.html

注意力机制可分为软和硬两类：

软性注意力（Soft Attention）机制是指在选择信息的时候，不是从N个信息中只选择1个，而是计算N个输入信息的加权平均，再输入到神经网络中计算。
相对的，硬性注意力（Hard Attention）就是指选择输入序列某一个位置上的信息，比如随机选择一个信息或者选择概率最高的信息。但一般还是用软性注意力机制来处理神经网络的问题。

根据Attention的计算区域，可以分成以下几种：
1）Soft Attention，这是比较常见的Attention方式，对所有key求权重概率，每个key都有一个对应的权重，是一种全局的计算方式（也可以叫Global Attention）。这种方式比较理性，参考了所有key的内容，再进行加权。但是计算量可能会比较大一些。
2）Hard Attention，这种方式是直接精准定位到某个key，其余key就都不管了，相当于这个key的概率是1，其余key的概率全部是0。因此这种对齐方式要求很高，要求一步到位，如果没有正确对齐，会带来很大的影响。另一方面，因为不可导，一般需要用强化学习的方法进行训练。（或者使用gumbel softmax之类的）
3）Local Attention，这种方式其实是以上两种方式的一个折中，对一个窗口区域进行计算。先用Hard方式定位到某个地方，以这个点为中心可以得到一个窗口区域，在这个小区域内用Soft方式来算Attention。

self-attention 实现

https://zhuanlan.zhihu.com/p/179959751

Starry memory

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
注意力机制

https://blog.csdn.net/weixin_42398658/article/details/90804173https://www.cnblogs.com/Luv-GEM/p/10712256.html
复制链接

扫一扫