【c1w4】- 吴恩达深度学习作业

最新推荐文章于 2024-06-19 21:37:28 发布

DisguiseR6

最新推荐文章于 2024-06-19 21:37:28 发布

阅读量361

点赞数

分类专栏： # 深度学习

本文链接：https://blog.csdn.net/qq_25614773/article/details/90611824

版权

深度学习专栏收录该内容

11 篇文章 0 订阅

订阅专栏

【c1w4】- 吴恩达深度学习作业总结

文章目录

【c1w4】- 吴恩达深度学习作业总结

0.总结

1.L-layer网络

输入为 X （12888,209）

m = 209 例子

在这里插入图片描述

2.前向传播

1.Linear Forward

$Z^{[l]} = W^{[l]}A^{[l-1]} +b^{[l]}$

2.Linear-Activation Forward

Sigmoid

ReLu

$A^{[l]} = g(Z^{[l]}) = g(W^{[l]}A^{[l-1]} +b^{[l]})$

激活函数"g" 可以是 sigmoid() 或者 relu()

3.L-Layer Model

[LINEAR -> RELU] × (L-1) -> LINEAR -> SIGMOID model

在这里插入图片描述

4.代价函数

$-\frac{1}{m} \sum\limits_{i = 1}^{m} (y^{(i)}\log\left(a^{[L] (i)}\right) + (1-y^{(i)})\log\left(1- a^{[L](i)}\right))$

'''交叉熵'''
 cost = - 1/m* np.sum((Y*np.log(AL))+(1-Y)*np.log(1-AL))

5.反向传播

1.Linear backward

dz 和 cache 求解 dW, db, da

$\begin{aligned} &dW^{[l]} = \frac{\partial \mathcal{L} }{\partial W^{[l]}} = \frac{1}{m} dZ^{[l]} A^{[l-1] T} \\ &db^{[l]} = \frac{\partial \mathcal{L} }{\partial b^{[l]}} = \frac{1}{m} \sum_{i = 1}^{m} dZ^{[l](i)} \\ &dA^{[l-1]} = \frac{\partial \mathcal{L} }{\partial A^{[l-1]}} = W^{[l] T} dZ^{[l]} \end{aligned}$

2.Linear-Activation backward

$dZ^{[l]} = dA^{[l]} * g'(Z^{[l]})$

6.参数更新

$\begin{aligned} &W^{[l]} = W^{[l]} - \alpha \text{ } dW^{[l]} \\ &b^{[l]} = b^{[l]} - \alpha \text{ } db^{[l]} \end{aligned}$

1.难点说明

1.np.sum()

$db^{[l]} = \frac{\partial \mathcal{L} }{\partial b^{[l]}} = \frac{1}{m} \sum_{i = 1}^{m} dZ^{[l](i)}$

# 压缩成一列
np.sum(dZ, axis=1, keepdim=True)

2.反向传播

对代价函数求导

'''对交叉熵的求导'''
dAL = - (np.divide(Y, AL) - np.divide(1 - Y, 1 - AL))

DisguiseR6

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【c1w4】- 吴恩达深度学习作业

【c1w4】- 吴恩达深度学习作业总结文章目录【c1w4】- 吴恩达深度学习作业总结0.总结1.L-layer网络2.前向传播1.Linear Forward2.Linear-Activation Forward3.L-Layer Model4.代价函数5.反向传播1.Linear backward2.Linear-Activation backward6.参数更新1.难点说明1.np.sum(...
复制链接

扫一扫

专栏目录