循环神经网络

超人汪小建(seaboat)

于 2017-07-28 19:38:56 发布

阅读量1.2w

点赞数 7

文章标签：深度学习 rnn 循环神经网络梯度消失梯度爆炸

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wangyangzhizhou/article/details/76278375

版权

深度学习同时被 2 个专栏收录

33 篇文章 ¥79.90 ¥99.00

订阅专栏

超级会员免费看

340 篇文章

订阅专栏

本文介绍了循环神经网络（RNN）的基本概念、与传统神经网络的区别，以及RNN的正向传播、训练过程和梯度消失/爆炸问题。通过实例展示了RNN在序列数据预测中的应用，并探讨了解决梯度消失的策略，如使用ReLU激活函数或LSTM、GRU结构。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

RNN是什么

循环神经网络即recurrent neural network，它的提出主要是为了处理序列数据，序列数据是什么？就是前面的输入和后面的输入是有关联的，比如一句话，前后的词都是有关系的，“我肚子饿了，准备去xx”，根据前面的输入判断“xx”很大可能就是“吃饭”。这个就是序列数据。

循环神经网络有很多变种，比如LSTM、GRU等，这里搞清楚基础的循环神经网络的思想，对于理解其他变种就比较容易了。

与传统神经网络区别

下图是我们经典的全连接网络，从输入层到两个隐含层再到输出层，四层之间都是全连接的，而且层内之间的节点不相连。这种网络模型对于序列数据的预测就基本无能为力，比如某句话的下一个单词是什么就很难处理。

循环神经网络则擅长处理序列数据，它会对前面的信息进行记忆并且参与当前输出的计算，理论上循环神经网络能处理任意长度的序列数据。

<

了解本专栏

超级会员免费看

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

超人汪小建(seaboat) 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。