递归神经网络 RNN

最新推荐文章于 2024-09-01 17:15:48 发布

llovew.

最新推荐文章于 2024-09-01 17:15:48 发布

阅读量700

点赞数 8

分类专栏：深度学习文章标签：神经网络 rnn 深度学习人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_61517307/article/details/136658402

版权

深度学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

递归神经网络（Recurrent Neural Network，RNN）是一种具有循环连接的神经网络结构，主要用于处理序列数据。它的原理是通过将当前时刻的输入和上一时刻的隐藏状态进行组合，来预测下一时刻的输出。

RNN的基本结构包括输入层、隐藏层和输出层。隐藏层中的神经元不仅接收当前时刻的输入，还接收上一时刻隐藏层的输出作为输入。这种循环连接使得RNN能够对序列数据进行建模，捕捉到数据中的时序信息。

在RNN中，每个时间步都有一个隐藏状态，用于存储过去时间步的信息。隐藏状态可以看作是网络对过去信息的记忆。通过不断迭代更新隐藏状态，RNN可以在处理序列数据时保留并利用之前的信息。

RNN 前向传播

在前向传播过程中，RNN会按照时间步骤依次处理输入序列。对于每个时间步骤t，RNN会根据当前输入和前一时刻的隐藏状态计算当前时刻的隐藏状态和输出。具体计算过程如下：

输入层到隐藏层：将当前时间步骤的输入和前一时刻的隐藏状态作为输入，通过权重矩阵和激活函数计算得到当前时刻的隐藏状态。
隐藏层到输出层：将当前时刻的隐藏状态通过权重矩阵和激活函数计算得到当前时刻的输出。

RNN的前向传播过程可以用以下公式表示：
h0 = f(W_hh * h_{t-1} + W_xh * x0_t)
y_t = g(W_hy * h_t)

其中，h0表示当前时刻的隐藏状态，x0_t表示当前时刻的输入，y_t表示当前时刻的输出。W_hh、W_xh和W_hy分别表示隐藏状态之间、输入与隐藏状态之间、隐藏状态与输出之间的权重矩阵。f和g是激活函数。

RNN的训练过程通常使用反向传播算法和梯度下降法来更新权重矩阵，以最小化预测输出与真实输出之间的误差。

RNN 反向传播

在反向传播过程中，我们需要计算损失函数对于各个参数的梯度，并更新参数以最小化损失。由于RNN的循环结构，我们需要在每个时间步骤上进行反向传播，并将梯度进行累加。

计算输出层的梯度：根据损失函数和输出层的输出，计算输出层的梯度。
反向传播到隐藏层：将输出层的梯度通过权重矩阵和激活函数计算得到隐藏层的梯度。
反向传播到前一时刻：将隐藏层的梯度传递到前一时刻的隐藏状态，并继续进行反向传播，直到传播到第一个时间步骤。
计算参数梯度并更新参数：根据各个时间步骤上的梯度，计算参数的梯度，并使用优化算法（如梯度下降）更新参数。

LSTM 网络架构

LSTM（Long Short-Term Memory）是一种常用的循环神经网络（RNN）架构，用于处理序列数据。它的设计目的是解决传统RNN在长序列训练中容易出现梯度消失或梯度爆炸的问题。

LSTM通过引入门控机制来控制信息的流动，主要包括遗忘门、输入门和输出门。下面是LSTM的基本原理：

1. 遗忘门（Forget Gate）：决定是否从细胞状态中丢弃信息。它通过一个sigmoid函数来输出一个0到1之间的值，表示保留多少旧信息。0表示完全忘记，1表示完全保留。

2. 输入门（Input Gate）：决定是否将新的信息添加到细胞状态中。它通过一个sigmoid函数来输出一个0到1之间的值，表示保留多少新信息。0表示完全忽略，1表示完全保留。

3. 更新细胞状态（Update Cell State）：根据输入门和遗忘门的输出，更新细胞状态。首先，通过一个tanh函数生成一个新的候选值向量，然后使用输入门的输出和候选值向量来更新细胞状态。

4. 输出门（Output Gate）：决定从细胞状态中输出多少信息。它通过一个sigmoid函数来输出一个0到1之间的值，表示输出多少信息。然后，将细胞状态通过一个tanh函数进行处理，并与输出门的输出相乘，得到LSTM的输出。

LSTM的门控机制使得它能够更好地捕捉长期依赖关系，并且能够有效地处理序列数据。它在自然语言处理、语音识别等领域取得了很好的效果。

关注

8
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

llovew.

CSDN认证博客专家 CSDN认证企业博客

码龄3年

33: 原创

6万+: 周排名

4万+: 总排名

3万+: 访问

: 等级

868: 积分

476: 粉丝

535: 获赞

13: 评论

591: 收藏

私信

关注

热门文章

分类专栏

Vue 3篇
Django 6篇
深度学习 4篇
OpenCV 1篇
机器学习 15篇
数学基础 5篇
Git学习 2篇
项目部署 1篇

最新评论

Django后台数据获取展示
随笔随流: 非常不错
Django后台数据获取展示
Q_M_Y_Y: 放到gitee上啊，大兄弟
卷积神经网络 CNN
征途黯然.: The explanation of 卷积神经网络CNN in this article is vivid, offering a deeper understanding.
Numpy、Pandas常用函数
CSDN-Ada助手: 恭喜作者撰写了如此有益的博客！对于我来说，Numpy和Pandas一直是一个挑战，因此这篇文章对我来说真是及时雨。希望作者能够继续分享更多关于数据处理和分析的知识，也许可以考虑分享一些实际案例或者深入的技巧，让读者更好地掌握这些常用函数的使用方法。期待作者的下一篇作品！
聚类分析实例
CSDN-Ada助手: 恭喜您发布了第17篇博客，聚类分析实例。您的持续创作精彩纷呈，让读者受益匪浅。希望您可以在下一篇博客中，可以分享一些实际案例或者应用场景，让我们更好地理解聚类分析的实际运用。期待您的下一篇作品！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。