吴恩达深度学习总结(1)

最新推荐文章于 2019-05-04 11:23:51 发布

夜夜0810

最新推荐文章于 2019-05-04 11:23:51 发布

阅读量365

点赞数

分类专栏：吴恩达深度学习文章标签： deaplearning

本文链接：https://blog.csdn.net/qq_33669204/article/details/83039620

版权

吴恩达深度学习专栏收录该内容

14 篇文章 2 订阅

订阅专栏

DeaplearningAI01.weak2

forward
backward

本周主要介绍了神经网络中forward和backward的一般实现和向量实现。一般实现较为简单，向量实现中存在一些疑点
$\boldsymbol{X}$ 是一个由训练集组成的矩阵，每一列代表一个数据，列数为数据的大小
$\boldsymbol{\omega}$ 是训练参数，大小与 $\boldsymbol{X}$ 一列的大小一致
$b$ 为偏差(bias)，为一个标量

forward

$\boldsymbol{Z} = np.dot(\boldsymbol{\omega}.T,\;\boldsymbol{X}) + b$
$\boldsymbol{A} = \sigma(\boldsymbol{Z})$ ，其中 $\sigma(\boldsymbol{x}) = \frac{1}{1-e^{-\boldsymbol{x}}}$
通过编程实现为 $1/(1-np.exp(-\boldsymbol{X}))$
Cost Function(Loss Function)通过矩阵实现时应该注意Cost Function是将所有的预测误差相加取平均得到的，不可以直接用矩阵乘法使其变为标量
$1/m*np.sum((-\boldsymbol{Y}*np.log(\boldsymbol{A})+(1-\boldsymbol{Y})*np.log(1-\boldsymbol{A})))$ ，其中m为样本的个数

backward

backward实际上是一个链式求导的过程，backward最根本的式子是通过梯度下降法来更新w和b
$\frac{\partial L}{\partial \boldsymbol{A}} = -(\frac{\boldsymbol{Y}}{\boldsymbol{A}}-\frac{1-\boldsymbol{Y}}{1-\boldsymbol{A}}) \frac{\partial \boldsymbol{A}}{\partial \boldsymbol{\boldsymbol{Z}}} = \boldsymbol{A}(1-\boldsymbol{A}) \frac{\partial \boldsymbol{Z}}{\partial \boldsymbol{\omega}} = \boldsymbol{X}$
所以，我们可以表示 $d\omega$ 为 $d\omega = np.dot(\boldsymbol{X},\;(\boldsymbol{A} - \boldsymbol{Y}).T)$ ，这个求解出来为m个样本训练出w的变化总和，因此应该除以m，所以为 $d\omega =1/m* np.dot(\boldsymbol{X},\;(\boldsymbol{A} - \boldsymbol{Y}).T)$ 。
同理可求 $d b$ ，但是由于b为标量，因此需要对求出的m次训练的b求和，即 $1/m*np.sum(\boldsymbol{A}-\boldsymbol{Y})$ 。根据这两个值即可以更新 $\omega$ 和 $b$

夜夜0810

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
吴恩达深度学习总结(1)

吴恩达深度学习总结DeaplearningAI01.weak2forwardbackwardDeaplearningAI01.weak2本周主要介绍了神经网络中forward和backward的一般实现和向量实现。一般实现较为简单，向量实现中存在一些疑点X\boldsymbol{X}X 是一个由训练集组成的矩阵，每一列代表一个数据，列数为数据的大小ω\boldsymbol{\omega}ω...
复制链接

扫一扫