Recurrent Neural Network (RNN)

最新推荐文章于 2024-07-13 14:27:17 发布

Danielzph

最新推荐文章于 2024-07-13 14:27:17 发布

阅读量308

点赞数

分类专栏：机器学习文章标签：神经网络

本文链接：https://blog.csdn.net/Danielzph/article/details/114645585

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Recurrent Neural Network (RNN)

RNN，或者说最常用的LSTM，一般用于记住之前的状态，以供后续神经网络的判断，它由input gate、forget gate、output gate和cell memory组成，每个LSTM本质上就是一个neuron，特殊之处在于有4个输入： $z$ 和三门控制信号 $z_i$ 、 $z_f$ 和 $z_o$ ，每个时间点的输入都是由当前输入值+上一个时间点的输出值+上一个时间点cell值来组成。

RNN

普通RNN结构图。

在这里插入图片描述

Elman Network & Jordan Network

Elman Network：将hidden layer的输出保存在memory里
Jordan Network：将整个neural network的输出保存在memory里

由于hidden layer没有明确的训练目标，而整个NN具有明确的目标，因此Jordan Network的表现会更好一些

在这里插入图片描述

Bidirectional RNN

RNN 还可以是双向的，你可以同时训练一对正向和反向的RNN，把它们对应的hidden layer $x^t$ 拿出来，都接给一个output layer，得到最后的 $y^t$

使用Bi-RNN的好处是，NN在产生输出的时候，它能够看到的范围是比较广的，RNN在产生 $y^{t+1}$ 的时候，它不只看了从句首 $x^1$ 开始到 $x^{t+1}$ 的输入，还看了从句尾 $x^n$ 一直到 $x^{t+1}$ 的输入，这就相当于RNN在看了整个句子之后，才决定每个词汇具体要被分配到哪一个槽中，这会比只看句子的前一半要更好

在这里插入图片描述

LSTM

前文提到的RNN只是最简单的版本，并没有对memory的管理多加约束，可以随时进行读取，而现在常用的memory管理方式叫做长短期记忆(Long Short-term Memory)，简称LSTM

冷知识：可以被理解为比较长的短期记忆，因此是short-term，而非是long-short term

Three-gate

LSTM有三个gate：

当某个neuron的输出想要被写进memory cell，它就必须要先经过一道叫做input gate的闸门，如果input gate关闭，则任何内容都无法被写入，而关闭与否、什么时候关闭，都是由神经网络自己学习到的
output gate决定了外界是否可以从memory cell中读取值，当output gate关闭的时候，memory里面的内容同样无法被读取
forget gate则决定了什么时候需要把memory cell里存放的内容忘记清空，什么时候依旧保存

在这里插入图片描述

整个LSTM可以看做是4个input，1个output：

4个input=想要被存到memory cell里的值+操控input gate的信号+操控output gate的信号+操控forget gate的信号
1个output=想要从memory cell中被读取的值

LSTM–单一神经元的情况：

在这里插入图片描述

LSTM–两层神经元的情况：

在这里插入图片描述

转载请注明：Daniel的博客

Danielzph

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Recurrent Neural Network (RNN)

Recurrent Neural Network (RNN)RNN，或者说最常用的LSTM，一般用于记住之前的状态，以供后续神经网络的判断，它由input gate、forget gate、output gate和cell memory组成，每个LSTM本质上就是一个neuron，特殊之处在于有4个输入：zzz和三门控制信号ziz_izi、zfz_fzf和zoz_ozo，每个时间点的输入都是由当前输入值+上一个时间点的输出值+上一个时间点cell值来组成。RNN普通RNN结构图。Elma
复制链接

扫一扫