【王树森】RNN模型与NLP应用(9/9)：Self-Attention（个人向笔记）

最新推荐文章于 2024-11-07 00:52:38 发布

好心的小明

最新推荐文章于 2024-11-07 00:52:38 发布

阅读量920

点赞数 22

文章标签： rnn 自然语言处理笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hxdxiaoming/article/details/141749112

版权

前言

上节课讲到的attention用到了Seq2Seq模型上，而Attention并不局限与Seq2Seq模型，而是可以用在所有RNN模型上。Self-attention在原论文中用到了LSTM上，而本节课做了简单的替换：换成了 Simple RNN。

SimpleRNN + Self-Attention

下面的 $h_0$ 为初始状态，是一个全0向量

无 Self-Attention 的更新状态：
有 Self-Attention 的更新状态：把 $h_0$ 换成了 $c_0$
接下来需要计算 $c_1$ ，上节课提到 $c$ 需要根据 $h$ 来计算，而此时 $h_0$ 为全 0 向量，所以 $c_1$ 就等于 $h_1$ ：
$h_2$ 同理：
相关性与 $c_2$ 的计算需要同时包含 $h_2$ ：后面的过程类似

在这里插入图片描述

Summary

Self-Attention能很大程度上解决RNN遗忘的问题
Self-Attenion和Attention的原理是一样的，但是Self-Attention不局限于Seq2Seq模型上，而是可以应用到所有RNN上
除了避免遗忘，Self-Attention还能帮助关注相关的信息

好心的小明

关注

22
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。