注意力机制以及应用

最新推荐文章于 2024-07-13 07:30:00 发布

Sigyc

最新推荐文章于 2024-07-13 07:30:00 发布

阅读量2.5k

点赞数 1

分类专栏： DL 文章标签：神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/github_31101389/article/details/106986278

版权

注意力机制以及应用

注意力机制的由来
实际运用

Attention成为了越来越来模型里绕不过去的坎，好像不过怎么样都加一个，那么注意力机制到底是什么以及计算流程和具体应用有哪些呢，今天来简单罗列一下。

注意力机制的由来

可以粗略地把注意力机制类比成一个可以专注于输入内容的某一子集（或特征）的神经网络，着力于占比不大但是格外重要的部分。

encoder-decoder

想要说明注意力机制的话首先要说明一下一种模型结构，就是nlp领域常用的编码-解码器架构（seq2seq的说话侧重点是输入输出的数据形式，虽然实际上这类问题常用编码-解码器结构，但是他们是不一样的）。
在这里插入图片描述
简单来说就是输入数据经过一个网络运算后得到一个语义向量c然后让解码器对其处理得到最后的输出。最大的局限性也就在于编码器和解码器之间的唯一联系就是一个语义向量C。有两点有待改进：1.c的长度限制了信息的表达；2.后输入的数据会覆盖带先输入的数据，除非记录每一个c（比如机器翻译的文章《Neural Machine Translation by Jointly Learning to Align and Translate》中引入attention就是为解码时每一步关注不同的c，充分利用序列信息）。

简单原理说明

注意力机制利用大致为输入一个query得到一个注意力，标志模型中输出对输入的侧重点，其流程如下。

用i时刻的解码器的隐状态 $H_i$ 去一一和输入产生的编码器每个隐状态 $h_j$

最低0.47元/天解锁文章

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
注意力机制以及应用

注意力机制以及应用注意力机制的由来二级目录三级目录Attention成为了越来越来模型里绕不过去的坎，好像不过怎么样都加一个，那么注意力机制到底是什么以及计算流程和具体应用有哪些呢，今天来简单罗列一下。注意力机制的由来可以粗略地把注意力机制类比成一个可以专注于输入内容的某一子集（或特征）的神经网络，着力于占比不大但是格外重要的部分。二级目录三级目录...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。