循环神经网路RNN学习笔记通俗易懂！

MoyiTech

已于 2023-10-11 09:48:03 修改

阅读量168

点赞数 6

文章标签： rnn 学习笔记

于 2023-10-11 09:46:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30650051/article/details/133761173

版权

本文介绍了循环神经网络RNN，特别是其变种NtoM（Encoder-Decoder/Seq2Seq）在处理实际问题中，如机器翻译，遇到的不等长序列挑战。长短期记忆网络LSTM的组成部分，包括遗忘门和输入门，也在文中详细解释。

摘要由CSDN通过智能技术生成

循环神经网路 RNN

小数据集低算力

$S=f(w_{in}X_t+b)$

$S_t=f(W_{in}X_t+W_{S}S_{t-1}+b)$

变种

输入序列，单输出

在这里插入图片描述

单输入，输出序列

在这里插入图片描述

输入不随序列变化

在这里插入图片描述

原始的N to N的RNN要求序列等长，然而我们遇到的大部分问题序列都是不等长的，如机器翻译中，源语言和目标语言的句子往往并没有相同的长度。
下面介绍RNN最重要的一个变种：N to M。这种结构又叫Encoder-Decoder模型，也可以称之为Seq2Seq模型。

在这里插入图片描述

从名字就能看出，这个结构的原理是先编码后解码。左侧的RNN用来编码得到c，拿到c后再用右侧的RNN进行解码。得到c有多种方式：

(1)把Encoder的最后一个隐状态赋值给c。: $c=h_4$

(2)对最后的隐状态做一个变换得到c。: $c=q(h_4)$

(3)对所有的隐状态做变换。 $c=q(h_1,h_2,h_3,h_4)$

在这里插入图片描述

长短期记忆网络 LSTM

在这里插入图片描述

forget gate 遗忘门

$f_1=sigmoid(w_1\begin{bmatrix}S_t-1 \\ x_t\end{bmatrix}+b_1)$

input gate 输入门

$f_2=sigmoid(w_2\begin{bmatrix}S_t-1 \\ x_t\end{bmatrix}+b_2)*tanh(w_2'\begin{bmatrix}S_t-1 \\ x_t\end{bmatrix}+b_2')$

$c_t = f_1*c_{t-1}+f_2$

关注

6
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
循环神经网路RNN学习笔记通俗易懂！

小数据集低算力S=f(winXt+b)S=f(w_{in}X_t+b)S=f(winXt+b)St=f(WinXt+WSSt−1+b)S_t=f(W_{in}X_t+W_{S}S_{t-1}+b)St=f(WinXt+WSSt−1+b)输入序列，单输出单输入，输出序列输入不随序列变化原始的N to N的RNN要求序列等长，然而我们遇到的大部分问题序列都是不等长的，如机器翻译中，源语言和目标语言的句子往往并没有相同的长度。下面介绍RNN最重要的一个变种：N to M。这种结构又叫Encode
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。