循环神经网络RNN

最新推荐文章于 2022-06-23 17:41:34 发布

简简丹

最新推荐文章于 2022-06-23 17:41:34 发布

阅读量436

点赞数

分类专栏：深度学习文章标签： tensorflow RNN

本文链接：https://blog.csdn.net/sinat_37386947/article/details/88873252

版权

循环神经网络（RNN）是一种处理序列数据的深度学习模型，其特点是能记忆序列信息并影响后续输出。RNN通过隐藏层节点间的连接，将历史信息传递给后续时刻。与传统神经网络相比，RNN的关键在于隐藏层的状态不仅取决于当前输入，还与之前的状态有关。在模型构建中，RNN可采用单一全连接层结构或LSTM结构，其中LSTM通过门控机制处理长期依赖问题。训练时，RNN可以展开成多层前馈网络，使用反向传播算法。RNN的应用包括序列预测，如时序数据的预测。

摘要由CSDN通过智能技术生成

输入与输出：
输入：序列上不同时刻的数据依次传入，每一时刻必须有输入
输出：对序列下一时刻的预测；对当前时刻信息的处理结果，每一时刻不一定要有输出。

用途：处理和预测序列数据。
当前输出与之前的信息有关，体现在网络结构上就是，就是会记忆之前的信息，并利用之前的信息影响后面节点的输出，即隐藏层之间的节点是有连接的，隐藏层的输入不仅包括输入层的输出，还包括隐藏层上一刻的输出。

对比

对比	全连接神经网络FNN	卷积神经网络CNN	循环神经网络RNN
网络结构	层与层之间节点全部连接，每层之间的节点无连接	层与层之间节点部分连接，每层之间的节点无连接	每层之间的节点有连接
参数共享	无	在不同的空间位置共享参数	在不同的时间位置共享参数
损失函数	—	----	每一时刻都有输出，总损失为所有时刻的损失函数的总和

理解
每一时刻对于模块A来说，读取输入 $x_t$ 以及上一刻的隐藏状态 $h_{t-1}$ ，得到输出 $o_t$ ，并且更新隐藏层的状态为 $h_t$ 。 $o_t$ 与 $h_t$ （ $o_t$ = $h_t$ ）都由 $x_t$ 和 $h_{t-1}$ 共同决定， $h_{t-1}$ 浓缩前面序列 $x_0$ 、 $x_1$ 、… $x_{t-1}$ 的信息，用于作为输出 $o_t$ 的参考。
注意1：在不同时刻，模块A的运算和变量是相同的，RNN可看做统一神经网络结构（循环体）被无限复制的结果，能够使用有限的参数处理任意长度的序列。
注意2：序列长度可以无限延长、但是 $h$ 状态维度有限，不可能将序列的全部信息保存下来，因此模型必须学习只保留与后面任务 $o_t$ 、 $o_{t+1}$ …相关的最重要的信息