Cousera - Deep Learning - 课程笔记 - Week 4

支锦铭

于 2020-04-24 01:06:05 发布

阅读量132

点赞数

分类专栏： Cousera-课程笔记文章标签：人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cary_leo/article/details/105722153

版权

Cousera-课程笔记专栏收录该内容

141 篇文章 17 订阅

订阅专栏

2018年9月版本

Week 4

深度L层神经网络 Deep L-layer neural network

具有多个隐藏层的神经网络模型（甚至可以把隐藏层层数作为超参数）
$L$ ，网络的层数
$n^{[l]}$ ，l层的单元个数
$a^{[l]}$ ，l层的激活值

深度网络的正向传播 Forward Propagation

$Z^{[l]}=W^{[l]}A^{[l-1]}+b^{[l]}$
$A^{[l]}=g^{[l]}(Z^{[l]})$
前向传播时，上述公式会因为隐藏层而被重复调用，这里可以使用一次for循环
$W^{[l]}:(n^{[l]},n^{[l-1]})$
$b^{[l]}:(n^{[l]},1)$
dW和db应该分别与W和b的维数相同

深度的意义 Deep

拥有众多隐藏层的神经网络能够让早期的神经层学习低级别的简单特征，后面更深的神经层可以汇聚之前的简单信息，以便检测更加复杂的事物
电路理论：有一些函数，可以使用一个比较小的深度网络计算，而使用浅层网络则有可能需要指数级的隐藏层单元

l层的正向传播 FP for Layer l

输入 $a^{[l-1]}$
输出 $a^{[l]}$ ，缓存 $z^[l])$ （理论上应该还有W和b）
$Z^{[l]}=W^{[l]}A^{[l-1]}+b^{[l]}$
$A^{[l]}=g^{[l]}(Z^{[l]})$

l层的反向传播 BP for Layer l

输入 $da^{[l]}$
输出 $da^{[l-1]},dW^{[l]},db^{[l]}$
$dZ^{[l]}=dA^{[l]}*g^{[l]\prime}(Z^{[l]})$
$dW^{[l]}=\frac{1}{m}dZ^{[l]}A^{[l-1]T}$
$db^{[l]}=\frac{1}{m}np.sum(dZ^{[l]},axis=1,keepdims=True)$
$dA^{[l-1]}=W^{[l]T}dZ^{[l]}$
注意，反向传播初始化（交叉熵代价函数求导） $da^{[L]}=-\frac{y}{a}+\frac{1-y}{1-a}$

参数和超参数 Parameters and Hyperparameters

神经网络模型中，参数就是W和b
神经网络模型中，超参数是需要额外设置的，用于调整模型能力（控制W和b）的参数
- 学习率
- 迭代次数
- 隐藏层层数
- 隐藏神经元个数
- 激活函数的选择
超参数一定程度上决定了W和b的最终结果

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。