CNN，RNN，LSTM，GRU的前后向传播算法（梯度是怎么更新的）

Billie使劲学

已于 2023-08-11 10:02:00 修改

阅读量1.5k

点赞数 6

分类专栏：深度学习 Pytorch基础知识学习文章标签： python 算法深度学习

于 2022-07-28 10:43:08 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_45447650/article/details/125981932

版权

Pytorch基础知识学习同时被 2 个专栏收录

18 篇文章 7 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

31 篇文章 8 订阅

订阅专栏

目录

1.简单的梯度计算

2.进阶的梯度计算

3.CNN前向后向算法

4.RNN前向后向算法

5.LSTM前向后向算法

6.GRU前向后向算法

为什么要计算梯度？

直观的讲，我们的网络通过 $y_i=\sigma (z_i)=\sigma (w_ix_i+b_i)$ 这样的方式进行学习计算，最终输出的结果y为网络根据标签学习来的，网络的第一次前向传播相当于自学，随意学习一种概率分布，但是我们想让预测的结果更加接近“答案”，那我们就需要计算预测与标签之间差距，即loss。然后我们通过降低loss的方式改变权重（更新梯度），缩小预测结果与真实值（标签）之间的差距。

1.简单的梯度计算

先看一个简单的：

以下图的反向传播为例：假设σ为sigmoid，C为代价函数。

下图（1）式为该网络的前向传播公式。

下一个结点的输入为上一个结点输出

了解本专栏

超级会员免费看

Billie使劲学

关注

6
点赞
踩
19

收藏

觉得还不错? 一键收藏
打赏
1
评论
CNN，RNN，LSTM，GRU的前后向传播算法（梯度是怎么更新的）

为什么要计算梯度？直观的讲，我们的网络通过这样的方式进行学习计算，最终输出的结果y为网络根据标签学习来的，网络的第一次前向传播相当于自学，随意学习一种概率分布，但是我们想让预测的结果更加接近“答案”，那我们就需要计算预测与标签之间差距，即loss。然后我们通过降低loss的方式改变权重（更新梯度），缩小预测结果与真实值（标签）之间的差距。...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Billie使劲学 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。