循环神经网络(RNN)

微信公众号

 本文同步更新在我的微信公众号里,地址:https://mp.weixin.qq.com/s/IPyI2Ee6Kzyv3wFAUN7NOQ

本文同步更新在我的知乎专栏里,地址:https://zhuanlan.zhihu.com/p/43190710


目录

1. 基本循环神经网络

2. 双向循环神经网络

2.1 双向循环神经网络的介绍

2.2 双向循环神经网络的训练

3. 深度循环神经网络

4. 循环神经网络的时间步长和参数共享

4.1 循环神经网络的time steps

4.2 循环神经网络的参数共享

5. 循环神经网络的训练算法(BPTT)

6. RNN的梯度消失和梯度爆炸

6.1 梯度消失

6.2 梯度爆炸

7. RNN的Long-Term依赖问题

8. RNN的几种架构

8.1 1 to 1

8.2 1 to N

8.3 N to 1

 8.4 N to N

8.5 N to M

Reference


1. 基本循环神经网络

传统的神经网络模型是从输入层到隐含层再到输出层的全连接,且同层的节点之间是无连接,网络的传播也是顺序的,但这种普通的网络结构对于许多问题却显得无能为力。例如,在自然语言处理中,如果要预测下一个单词,就需要知道前面的部分单词,因为一个句子中的单词之间是相互联系的,即有语义。这就需要一种新的神经网络,即循环神经网络RNN,循环神经网络对于序列化的数据有很强的模型拟合能力。具体的结构为:循环神经网络在隐含层会对之前的信息进行存储记忆,然后输入到当前计算的隐含层单元中,也就是隐含层的内部节点不再是相互独立的,而是互相有消息传递。隐含层的输入不仅可以由两部分组成,输入层的输出和隐含层上一时刻的输出,即隐含层内的节点自连;隐含层的输入还可以由三部分组成,输入层的输出、隐含层上一时刻的输出、上一隐含层的状态,即隐含层内的节点不仅自连还互连。结构如图1所示。

图1:循环神经网络结构图

在图1中,可以看到隐含层节点间有消息的相互传递。为了更简单的理解,现在我们将RNN在时间坐标轴上展开成一个全神经网络,如图2所示。例如,对一个包含3个单词的语句,那么展开的网络便是一个有3层的神经网络,每一层代表一个单词。

 

图2:循环神经网络展开图标题

 

对于图2的网络,计算过程如下:

  • x_t表示第t步(step)的输入。比如x_1为第二个词的词向量(x_0为第一个词);

  • 2
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
循环神经网络(RNN)是一种神经网络结构,用于处理序列数据。与传统的前馈神经网络不同,RNN具有循环连接,使得信息可以在网络中传递并保持记忆。RNN的每个时间步都接收一个输入和一个隐藏状态,然后根据当前输入和前一个时间步的隐藏状态计算当前时间步的输出和新的隐藏状态。这种循环结构使得RNN能够对序列数据进行建模和预测。\[1\] RNN的结构可以通过展开图来表示,其中每个时间步都对应一个神经元。在标准的RNN结构中,隐藏层的神经元之间也存在权重连接,使得前面的隐藏状态可以影响后面的隐藏状态。这种权值共享的特点使得RNN能够处理不同长度的序列数据,并且能够捕捉到序列中的时间依赖关系。\[3\] RNN的训练过程通常使用误差值的反向传播和梯度下降算法来更新权重。然而,与前馈神经网络不同,RNN的训练过程需要考虑时间上的依赖关系,因此标准的反向传播算法无法直接应用于RNN。\[2\] 总之,循环神经网络(RNN)是一种具有循环连接的神经网络结构,用于处理序列数据,并能够捕捉到序列中的时间依赖关系。它的训练过程需要考虑时间上的依赖关系,并使用误差值的反向传播和梯度下降算法来更新权重。 #### 引用[.reference_title] - *1* *3* [[深度学习-原理篇]什么是循环神经网络RNN与LSTM](https://blog.csdn.net/keeppractice/article/details/107373069)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [新手你还在苦苦学习神经网络?看完本文相信你必会恍然大悟](https://blog.csdn.net/m0_37971088/article/details/81167475)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值