吴恩达机器学习——反向传播算法

最新推荐文章于 2024-09-04 09:09:05 发布

Donreen

最新推荐文章于 2024-09-04 09:09:05 发布

阅读量2.5k

点赞数 36

分类专栏：机器学习入门文章标签：吴恩达机器学习反向传播算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/carrylvan/article/details/102572385

版权

机器学习入门专栏收录该内容

19 篇文章 5 订阅

订阅专栏

吴恩达机器学习——反向传播算法

- 1.误差 $\delta^{(3)}$, $\delta^{(2)}$的推导
- 2.反向传播算法的计算过程

前言：反向传播算法是用来求偏导数的，即

\frac{\sigma{J(\theta)}}{\sigma{\theta^{(2)}_{ij}}}

，有了这个偏导数，就可以使用梯度下降算法或其他高级算法得出

\theta

1.误差 $\delta^{(3)}$ , $\delta^{(2)}$ 的推导

反向传播算法中误差的计算过程：
在这里插入图片描述
首先，这里没有使用线性回归中的平方差来计算，而是直接定义了 $\delta^{(4)}=a^{(4)}-y,\text{即预测值减去实际值}$

接下来我们看一下 $\delta^{(3)}$ 的推导过程：
在这里插入图片描述
1.代价函数（这里我们考虑最简单的情况，k=1，并且只考虑一个训练样本（ $x^{(i)}$ , $y^{(i)}$ ））：
$cost(i)=-y^{(i)}*log(h(x^{(i)}))-(1-y^{(i)})log(1-h(x^{(i)}))$
2.误差计算公式： $\delta^{(l)}_{j}=\frac{\sigma{cost(i)}}{\sigma{z^{(l)}_j}}$ .
这里的误差计算公式为什么和 $\delta^{(4)}$ 不一样呢？我们先看一下等式右边的偏导数等于多少。
在这里插入图片描述
【说明：上图中的 $y^{(i)}$ 是实数而不是向量，因为我们这里暂时只考虑了k=1的情况。】
可以看到和 $\delta^{(4)}$ 的定义是一样的。网上也看到其他说法：?是代价函数关于所计算出的中间项 z 的偏导数，它所衡量的是：为了影响这些中间值，我们所需要改变神经网络中的权重的程度。

3. $\delta^{(3)}，\delta^{(2)}$ 的推导

2.反向传播算法的计算过程

在这里插入图片描述
$\Delta^{(l)}_{ij}$ 的推导过程：

关注

36
点赞
踩
57

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。