Attention注意力机制

最新推荐文章于 2022-10-22 17:22:55 发布

allen wy

最新推荐文章于 2022-10-22 17:22:55 发布

阅读量1.1k

点赞数

文章标签： nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_53582111/article/details/123756278

版权

一、概念

深度学习中的注意力机制从本质上讲和人类的选择性视觉注意力机制类似，核心目标也是从

众多信息中选择出对当前任务目标更关键的信息。

二、Encoder-Decoder 框架引入Attention注意力机制的结构图

ENcoder-Decoder参考Encoder-Decoder 框架_宠乖仪的博客-CSDN博客

生成的目标如下

推广：

yi = f1(Ci,y1,y2,y3,...,yi-1)

，一般的做法中，Ci对构成元素加权求和，即下列公式：

其中，Lx 代表输入句子 Source 的长度，aij 代表在 Target 输出第 i 个单词时 Source 输入

句子中第 j 个单词的注意力分配系数，而 hj 则是 Source 输入句子中第 j 个单词的语义编码(指Encoder 对输入英文单词的某种变换函数。如果 Encoder 是用的RNN 模型的话，语义编码往往是某个时刻输入 xi 后隐层节点的状态值)。

三、Attention算法流程

流程：

1、求attention weights (注意力机制的权重)

1.1 方法

余弦相似度
一个简单的神经网络
矩阵变换α=hTWzα=hTWz(hT是encode层的隐藏层的输出，z是decode层的隐藏层的输出，W是hT和z相乘的权重，然后用softmax归一化得到attention weights权重)

2、求上下文连续的向量(Context Vector)

3、求attention vector (注意力机制的向量)

之后把值输出和传入到下一时刻，依次循环

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Attention注意力机制

一、概念深度学习中的注意力机制从本质上讲和人类的选择性视觉注意力机制类似，核心目标也是从众多信息中选择出对当前任务目标更关键的信息。二、Encoder-Decoder 框架引入Attention注意力机制的结构图ENcoder-Decoder参考Encoder-Decoder 框架_宠乖仪的博客-CSDN博客生成的目标如下推广：yi = f1(Ci,y1,y2,y3,...,yi-1)，一般的做法中，Ci对构成元素加权求和，即下列公式：其中，Lx 代表
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

allen wy 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。