神经网络中的反向传播（梯度下降）

最新推荐文章于 2023-03-07 16:00:22 发布

CV/NLP大虾

最新推荐文章于 2023-03-07 16:00:22 发布

阅读量2.2k

点赞数 4

分类专栏：优化

本文链接：https://blog.csdn.net/m0_37400316/article/details/105753857

版权

2 篇文章 0 订阅

订阅专栏

梯度下降：

反向传播法：

由于深度学习网络按层深入，层层嵌套的特点，对深度网络目标函数计算梯度的时候，需要用反向传播的方式由深到浅倒着计算以及更新参数。所以反向传播法是梯度下降法在深度网络上的具体实现方式。

一句话总结就是反向传播法采用链式法则进行偏导作用在各个层，并采用梯度下降的优化算法进行每层权重的更新。
下面就通过公式推导和例子来进行分析神经网络的权重更新过程：

给i一个简单的传播函数：

y = wx + b
误差error：
在这里插入图片描述
代入则得到Cost = (wx+b - Y)^2
Cost = (Error)^2 　Error = wx+b-Y

通过以上就可求出偏导：

在这里插入图片描述
如图所示：前向传播就不多说了，直接累乘加激活即可完成每层前传值。
现在说下后向传播：

在这里插入图片描述

W5权值更新

同理

W1权值更新
W1涉及多个输出反馈来进行更新

为了进行对每层中每个w进行更新，简化公式直接和输入计算出梯度：

关注