李宏毅机器学习back propogation反向传播

最新推荐文章于 2024-08-24 15:14:15 发布

lxmm1999

最新推荐文章于 2024-08-24 15:14:15 发布

阅读量120

点赞数 1

分类专栏：李宏毅机器学习文章标签：深度学习神经网络机器学习

本文链接：https://blog.csdn.net/weixin_41571641/article/details/114946565

版权

李宏毅机器学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

回顾梯度下降：
有一堆参数 $\theta= {w_1,w_2,...,b_1,b_2,... }$
首先由一个初始化值 $\theta^0$
计算损失函数的梯度 $\triangledown L(\theta^0)$
迭代 $\theta$

参数过多，这么多梯度怎么办？BP算法提供了一种快速计算梯度的方法
回顾链式求导法则

BP

$\hat{y}^n$ 是理想输出； $y^n$ 是实际输出
$C^n$ 表示 $y^n$ 和 $\hat{y}^n$ 之间的距离
先看第一层

BP-Forward pass

显然
在这里插入图片描述
所以，可以总结出：z对w的偏导数是前一个神经元/激活函数的输出值

这个计算过程是从前到后的，因此叫做Forward pass

BP-backward pass

为了计算 $\partial C / \partial z$ ,将其拆成 $\partial C / \partial a$ 和 $\partial a / \partial z$
因为 $a=\sigma(z)$
所以 $\partial a / \partial z=\sigma'(z)$
在这里插入图片描述

那么 $\partial C / \partial a$ 怎么算呢？

显然，a通过影响 $z^{'}$ 和 $z^{''}$ 影响C

在这里插入图片描述

现在的问题是画问号的两项未知
假设我们已经算出

case1 假设是最后一层

只需要知道输出层函数，就可以轻松算出$\partial y_1 / \partial z’；而 $\partial C/\partial y_1$ 由loss函数也可以轻松算出
case2 不是最后一层

同理于

可以由 $\partial C / \partial z_a$ 和 $\partial C/\partial z_b$ 算出 $\partial C / \partial z'$

所以从output layer往前算，就能算出所有 $\partial C / \partial z$

在这里插入图片描述

Summary

信号正向传播，误差反向传播，乘起来就是所求梯度
在这里插入图片描述

lxmm1999

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
李宏毅机器学习back propogation反向传播

回顾梯度下降：有一堆参数 θ=w1,w2,...,b1,b2,...\theta= {w_1,w_2,...,b_1,b_2,... }θ=w1,w2,...,b1,b2,...首先由一个初始化值θ0\theta^0θ0计算损失函数的梯度▽L(θ0)\triangledown L(\theta^0)▽L(θ0)迭代θ\thetaθ参数过多，怎么办？BP算法是一种能快速算出梯度的方法回顾链式求导法则BPy^n\hat{y}^ny^n是理想输出；yny^nyn是实..
复制链接

扫一扫

专栏目录