李宏毅机器学习(2017)学习笔记——7-反向传播算法

最新推荐文章于 2023-08-07 21:57:02 发布

xixi_twinkle

最新推荐文章于 2023-08-07 21:57:02 发布

阅读量408

点赞数 2

分类专栏：李宏毅_机器学习（2017）文章标签：神经网络深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42249031/article/details/117086969

版权

李宏毅_机器学习（2017）专栏收录该内容

11 篇文章 5 订阅

订阅专栏

目录

1. 反向传播算法在梯度下降法中的运作原理

2. 链式法则

3. 反向传播算法

1. 反向传播算法在梯度下降法中的运作原理

我们在使用梯度下降法训练神经网络时需要使用反向传播算法。

在梯度下降法中，有超参数w和b。首先选定初试参数，计算对损失函数的梯度，也就是计算神经网络中每一个参数的对损失函数的偏微分。计算完可以进行参数的更新。持续进行这一过程得到最优参数。

因为在神经网络中参数数量较多，所以使用反向传播算法有效的计算梯度。

2. 链式法则

3. 反向传播算法

反向传播的损失函数是，其中是和之间的距离，越大表示损失值越大。为了求得损失值的最小值，我们对损失函数进行求偏导。

首先拿出一个神经元进行考虑，这个神经元的输入是外界的输入和，和分别乘上权重和再加上b得到z。得到z之后通过激活函数并通过进一步处理得到最终的输出和。按照链式法则可以拆成两项。计算称为正推法，但是计算称为反推法。

怎么计算呢？

这个是可以秒解的。规律在于：计算时，看w前面接的是什么微分后就是什么。如下图所示。

怎么计算呢？

这一项显然是不太好算的，我们需要使用链式法则对这项进行拆解。

首先假设激活函数是sigmoid函数，z通过sigmoid函数后得到a，a会通过权重再加上其他的值之后得到，a还会通过权重加上其他值得到。

所以，就是sigmoid函数的微分，

但是和我们无法算出，我们假设我们知道这两项的值，所以。

我们可以从另外一个观点看待这个式子。

我们可以想象有另外一个不在神经网络中的神经元，简化成下图中的三角形。这个神经元的输入就是和，第一个输入乘上，第二个输入乘上，求和后再乘上激活函数就得到。

其实是一个常数，以内z在计算正推法的时候就已经被决定好了。

其实，只要能计算出和，问题就可以迎刃而解。

那么怎么计算这两项呢？

情况一：假设两个红色的神经元是输出层

所以

情况二：假设两个红色的神经元不是输出层

我们同样可以使用反向传播进行计算

可是我们又不知道如何计算和的偏微分。如果不是最后一层，一直不断的计算，直到最后一层是输出层。

上面的方法听起来计算量很大，实际上，我们只需要换一个方向，从输出层的，往回计算。

总结：

首先做一个正向传播，可以算出。在反向传播中，把原来的神经网络的方向倒过来，每一个神经元的输出就是，把他们乘起来得到。

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
李宏毅机器学习(2017)学习笔记——7-反向传播算法

1. 反向传播算法在梯度下降法中的运作原理我们在使用梯度下降法训练神经网络时需要使用反向传播算法。在梯度下降法中，有超参数w和b。首先选定初试参数，计算对损失函数的梯度，也就是计算神经网络中每一个参数的对损失函数的偏微分。计算完可以进行参数的更新。持续进行这一过程得到最优参数。因为在神经网络中参数数量较多，所以使用反向传播算法有效的计算梯度。2.链式法则 ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。