[Deep Learning] 反向传播算法（Backpropagation Algorithm）

Oh_MyBug

于 2020-02-18 16:37:21 发布

阅读量646

点赞数

CC 4.0 BY-SA版权

分类专栏： Deep Learning 文章标签：深度学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Oh_MyBug/article/details/104377696

本文详细介绍了反向传播算法，通过链式法则解释了如何计算神经网络的权重梯度。首先，阐述了链式法则在两种情况下的应用，接着通过实例详细解释了反向传播的过程，包括前向传播计算∂ωi∂zi和反向传播计算∂z∂l，最后总结了反向传播算法的重要性和工作原理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Chain Rule（链式法则）

Case 1

如果有：

$g(x)\ \ \ \ \ \ z = h(y)$

那么“变量影响链”就有：

$\Delta x\rightarrow \Delta y \Delta z$

因此就有：

$\frac{d z}{d x} = \frac{d z}{d y}\frac{d y}{d x}$

Case 2

如果有：

$g(s)\ \ \ \ \ \ y = h(s)\ \ \ \ \ \ z=k(x,y)$

那么“变量影响链”就有：

因此就有：

$\frac{d z}{d s} = \frac{\partial z}{\partial x}\frac{d x}{ds} + \frac{\partial z}{\partial y}\frac{d y}{ds}$

Backpropagation（反向传播算法）——实例讲解

定义

反向传播（英语：Backpropagation，缩写为BP）是“误差反向传播”的简称，是一种与最优化方法（如梯度下降法）结合使用的，用来训练人工神经网络的常见方法。该方法对网络中所有权重计算损失函数的梯度。这个梯度会反馈给最优化方法，用来更新权值以最小化损失函数。（误差的反向传播）——维基百科

说明

假设现在有N个样本数据，那么实际上损失函数可以表示为：

$L(\theta) = \sum_{n=1}^Nl^n(\theta)$

其中 $\theta$ 为需要学习的参数。

那么现在 $\omega$ 对 $L$ 进行偏微分，实际上是对每个样本数据的损失函数 $l(\theta)$ 进行偏微分后再求和：

$\frac{\partial L(\theta)}{\partial \omega} = \sum_{n=1}^N\frac{\partial l^n(\theta)}{\partial \omega}$

用代数表示为：

$z_1 = \omega_{11}x_1 + \omega_{12}x_2 + b_1 \ \ \ \ \ \ \ \ \ \ \ a_1 = \sigma(z_1)$

$z_2 = \omega_{21}x_1 + \omega_{22}x_2 + b_2 \ \ \ \ \ \ \ \ \ \ \ a_2 = \sigma(z_2)$

$z_3 = \omega_{31}a_1 + \omega_{32}a_2 + b_3 \ \ \ \ \ \ \ \ \ \ \ a_3 = \sigma(z_3)$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。