吴恩达深度学习_第一课(4)《深层神经网络》

最新推荐文章于 2024-07-19 16:50:04 发布

叮叮咚咚小皮皮

最新推荐文章于 2024-07-19 16:50:04 发布

阅读量72

点赞数

分类专栏： DeepLearning 文章标签：深度学习神经网络人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45629864/article/details/132108711

版权

DeepLearning 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

深层神经网络

描述深层神经网络的符号

本网络层数为4，隐藏层数为3
在这里插入图片描述

本网络是一个4层神经网络：L = 4 （输入层不计入）
第L层的神经元个数：n^[L]，例如：n^[1]=5，n^[3]=3 ，n^[0]=3 （输入层为0层）
第L层的激活值：a^[L] ( =g^[L](z^[L]) )，例如：X = a^[0]， $\widehat{y}$ = a^[L]
第L层的权重值：z^[L]

深层网络的前向传播

在这里插入图片描述

每层前向传播找到的规律如下（已矩阵化）：
Z^[L] = W^[L]A^[L-1] + b^[L]
A^[L] = g^[L]( Z^[L] )

在层间计算的时候，不可避免使用for循环，并且在运算时一定要注意矩阵维数的变化，大佬也是用笔画一画写一写。

核对矩阵的维数

参数矩阵 W^{[ i ]}

在这里插入图片描述
前情提要：z矩阵每一列是一个样本，Z^{[2] (1)}，Z^{[2] (2)}…Z^{[2] (m)} 分别是第1个样本，第2个样本…第m个样本在第2隐藏层的运算值。

本质是将输入的2个特征点，经过w矩阵，转换为3个特征点，以一个sample为例：

先考虑Z^[1]矩阵，期望维度是(3,1) 即 (n^[1],1)；再看X矩阵，已知维度是(2,1) 即 (n^[0],1)。
需要W^[1]矩阵完成X维度=>Z维度的转换。所以W^[1]的维度是 (3,2) 即 (n^[1],n^[0])。
m个样本时，上面两步骤中维度"1"换为"m"即可：Z^[1]期望维度是(3,m)，X已知维度是(2,m)

直接记忆公式：
W^[L] 维度：(n^[L] , n^[L-1])
Z^[L] 维度：(n^[L] , m)
X 维度：(n^[0] , m)

A^[L] 维度应该与 Z^[L] 维度一致

参数矩阵 b^{[ i ]}

在这里插入图片描述
因为要进行矩阵加法，所以形状应该和W^[1]X 一致，其实也和Z^[1]的期望维度一致，所以也是 (3,1) 。

直接记忆公式：
b^[L] 维度：(n^[L] ,1 )

反向传播中

dw维度和 w维度一致

db维度和 b维度一致

深层网络的优势

例如下面这个电路原理计算：
左侧是深层网络，每层神经元较少且逐步递减。
右侧是单层网络，隐含层需要达到指数级的极多个神经元
在这里插入图片描述

搭建深层网络块

某一层网络的正向传播和反向传播

上面方块是该层自左向右是正向传播，下面方块是该层自右向左是反向传播
在这里插入图片描述

正向传播：输入为a^[L-1]，使用本层w^[L] 和b^[L] 进行计算，算出z^[L] 并在cache中存储，输出a^[L]。
反向传播：输入da^[L]，使用本层w^[L]和b^[L]，算出dz^[L]，算出dw^[L] 和db^[L] 并在grads中存储，输出da^[L-1]

深层网络的正向传播和反向传播

每一组上下两个方块代表网络的一层。
在这里插入图片描述
正向传播和反向传播与上面单层网络的传播类似，只需要考虑多层网络的输入输出前后相继的问题。

前向和反向传播实现

前向传播

正常的公式：
在这里插入图片描述

反向传播

左侧公式大多数和上一周的单层网络类似

其中da^[L-1] = w^[L].T · dz^[L] 的推导原因尚未清楚。

在这里插入图片描述

反向传播的初始化

因为反向传播时，最初的输入相当于da^[L]，而da相当于L对a^[L]求导，因此
在这里插入图片描述
在矩阵中，由于A^[L]的维度也是(n^[L],m) ，所以向量化之后，也是横着拼在一个(n^[L],m)的向量中

参数和超参数

超参数：控制实际参数： 参数W 和 参数b 的参数。

例如：学习率，迭代次数，隐藏层数量，隐藏层神经元数量，激活函数的选择。

在这里插入图片描述

叮叮咚咚小皮皮

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
吴恩达深度学习_第一课(4)《深层神经网络》

本网络层数为4，隐藏层数为3y。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。