RNN及其公式推导

最新推荐文章于 2025-05-12 11:28:23 发布

疯女孩爱飞

最新推荐文章于 2025-05-12 11:28:23 发布

阅读量1.2w

点赞数 6

CC 4.0 BY-SA版权

分类专栏：学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ustbfym/article/details/77970030

本文详细介绍了循环神经网络（RNN）的基本结构和公式推导，包括前向算法和反向传播算法（BPTT）的关键步骤。通过分析RNN的隐藏层和输出层之间的关系，以及误差项和权重更新的计算，帮助读者深入理解RNN的工作原理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

RNN及其公式推导

RNN即循环神经网络，循环神经网络的种类有很多，本文主要是对基本的神经网络进行推导。一开始对推导很晕，在阅读了许多资料之后，整理如下。

结构

这里写图片描述

上图所示的是最基本的循环神经网络，但是这个图是抽象派的，只画了一个圈不代表只有一个隐层。如果把循环去掉，每一个都是一个全连接神经网络。 $x$ 是一个向量，它表示输入层， $s$ 也是一个向量，它表示隐藏层，这里需要注意，一层是有多个节点，节点数与 $s$ 的维度相同。 $U$ 是输入层到隐藏层的权重矩阵，与全连接网络的权重矩阵相同， $o$ 也是一个向量，它表示输出层， $V$ 是隐藏层到输出层的权重矩阵。

公式推导

这里写图片描述

　　RNN的BPTT算法关键就在于理解上图。前向算法很好理解，根据RNN的结构定义则很容易推出，下面是后向算法的推导。它的基本原理和BP算法一样的，同样包含了三个步骤:
　　1. 前向计算每个神经元的输出值
　　2. 方向计算每个神经元的误差项 $\delta_j$ ，它的误差项是指误差函数 $E$ 对神经元 $j$ 的加权输入的偏导数，如上图所示(下文将 $a_j^t$ 记作 $net_j ^t$ )
　　3.计算每个权重的梯度，然后用优化算法更新

　　误差项计算
　　
让我们回到第一张图的表示方法，用向量

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。