神经网络DNN的反向传播

最新推荐文章于 2022-11-17 22:21:43 发布

且行且安~

最新推荐文章于 2022-11-17 22:21:43 发布

阅读量786

点赞数 1

分类专栏：深度学习文章标签：神经网络反向传播

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_20412595/article/details/83213421

版权

深度学习专栏收录该内容

14 篇文章 1 订阅

订阅专栏

前言：在学习一段时间神经网络后，发现自己对神经网络的反向传播还是有点问题，在反过来复习吧，前向传播没有什么费劲的地方，这里就不会过多的阐述。

1、单层的反向传播

一步步来看，先看看简单的情况，单层的反向传播是理解多层神经网络的基础。

基础：梯度与梯度下降算法，前面有讲解过，这里直接给出结论。

从这上面看出，这里是以平方为误差来计算的， $J(\theta )$ 的导数为 $(h_{\theta }(x)-y)x$ ，则梯度的负方向为 $(y-h_{\theta }(x))x$ 。故直接带到w的方程中。

W的更新状态方程： $W_{i} += W_{i}+\bigtriangledown W_{i}$

2、多层的反向传播

3、推导过程

这里的推导参考一个博客大牛的，由于公式较多，直接复制过来啦。

计算到输出层第L层对应的 $a^{L}$ 即为前向传播算法计算出来的输出：

我们期望最小化下式：

首先是输出层第L层。注意到输出层的W,b满足下式：

求解W,bW,b的梯度：

我们可以把公共的部分即对 $z^{L}$ 先算出来，记为：

根据上式我们可以很方便的计算出第L层的 $W^{L},b^{L}$ 的梯度如下：

这其实和上面手写的例子结构很类似了。

假设第L+1层的 $\delta ^{l+1}$ 已经求出来了，那么我们如何求出第L层的 $\delta ^{l}$ 呢？我们注意到：

而 $z^{l+1}$ 和 $z^{l}$ 的关系其实很容易找出：( $z^{l}$ 就是第L层输出前进行激活函数的值)

我们得到：

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
神经网络DNN的反向传播

前言：在学习一段时间神经网络后，发现自己对神经网络的反向传播还是有点问题，在反过来复习吧，前向传播没有什么费劲的地方，这里就不会过多的阐述。1、单层的反向传播一步步来看，先看看简单的情况，单层的反向传播是理解多层神经网络的基础。基础：梯度与梯度下降算法，前面有讲解过，这里直接给出结论。从这上面看出，这里是以平方为误差来计算的，的导数为，则梯度的负方向为。故直接带到w的方程中。...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

且行且安~ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。