01. 神经网络和深度学习 ——week4 深层神经网络

最新推荐文章于 2019-02-25 12:02:56 发布

涛涛酱

最新推荐文章于 2019-02-25 12:02:56 发布

阅读量265

点赞数

分类专栏：深度学习深度学习课程——吴恩达吴恩达——深度学习课程文章标签：吴恩达深度学习

深度学习同时被 3 个专栏收录

26 篇文章 1 订阅

订阅专栏

深度学习课程——吴恩达

24 篇文章 0 订阅

订阅专栏

吴恩达——深度学习课程

23 篇文章 1 订阅

订阅专栏

4.1 矩阵的维数

DNN结构示意图：

对于第 $l$ 层神经网络，单个样本及各个参数的矩阵维度为：
$W^{[l]} ： (n^{[l]},n^{[l-1]})$
$b^{[l]} ： (n^{[l]},1)$
$dW^{[l]} ： (n^{[l]},n^{[l-1]})$
$db^{[l]} ： (n^{[l]},1)$
$Z^{[l]} ： (n^{[l]},1)$
$A^{[l]}=Z^{[l]} ： (n^{[l]},1)$

4.2 为什么使用深层表示

在这里插入图片描述
对于人脸识别，神经网络的第一层从原始图片中提取人脸的轮廓和边缘，每个神经元学习到不同边缘的信息；网络的第二层将第一层学得的边缘信息组合起来，形成人脸的一些局部的特征，例如眼睛、嘴巴等；后面的几层逐步将上一层的特征组合起来，形成人脸的模样。随着神经网络层数的增加，特征也从原来的边缘逐步扩展为人脸的整体，由整体到局部，由简单到复杂。层数越多，那么模型学习的效果也就越精确。

对于语音识别，第一层神经网络可以学习到语言发音的一些音调，后面更深层次的网络可以检测到基本的音素，再到单词信息，逐渐加深可以学到短语、句子。

所以从上面的两个例子可以看出随着神经网络的深度加深，模型能学习到更加复杂的问题，功能也更加强大。

4.3 前向和反向传播

DNN的一些参数：

$L ：$ DNN的总层数；
$n^{[l]}：$ 表示第 $l$ 层包含单元的个数；
$a^{[l]}：$ 表示第 $l$ 层激活函数的输出；
$W^{[l]}：$ 表示第 $l$ 层的权重；
输入 $x$ 又为 $a^{[0]}$ ，输出 $\hat{y}$ 又为 $a^{[L]}$ .

前向传播：

Input： $a^{[l-1]}$
Output： $a^{[l]} ， \rm cache(z^{[l]})$
公式：
向量化程序：

反向传播：

Input： $da^{[l]}$
Output： $da^{[l-1]} ， dW^{[l]} ，db^{[l]}$
公式：
向量化程序：

4.4 参数和超参数

参数： 在训练过程中想要模型学习到的信息， $W^{[l]}$ ， $b^{[l]}$ 。

超参数： 控制参数的输出值的一些网络信息，也就是超参数的改变会导致最终得到的参数 $W^{[l]}$ ， $b^{[l]}$ 的改变。

超参数举例：

学习速率： $\alpha$
迭代次数：N
隐藏层的层数：L
每一层的神经元个数： $n^{[1]}，n^{[2]}，...$
激活函数 $g (z)$ 的选择

本文完全来自：https://blog.csdn.net/koala_tree/article/details/78087711

涛涛酱

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
01. 神经网络和深度学习 ——week4 深层神经网络

4.1 矩阵的维数DNN结构示意图：对于第 lll 层神经网络，单个样本及各个参数的矩阵维度为：W[l]：(n[l],n[l−1])W^{[l]} ： (n^{[l]},n^{[l-1]})W[l]：(n[l],n[l−1])b[l]：(n[l],1)b^{[l]} ： (n^{[l]},1)b[l]：(n[l],1)dW[l]：(n[l],n[l−1])dW^{[l]} ： (n^...
复制链接

扫一扫