机器学习吴恩达第五周

身影王座

于 2020-07-15 16:52:25 发布

阅读量314

点赞数

分类专栏： # 机器学习吴恩达（基础）文章标签：机器学习神经网络算法人工智能 Octave

本文链接：https://blog.csdn.net/qq_42148307/article/details/107364417

版权

机器学习吴恩达（基础）专栏收录该内容

18 篇文章 12 订阅

订阅专栏

9、神经网络的学习

9.1代价函数

假设神经网络的训练样本有𝑚个，每个包含一组输入𝑥和一组输出信号𝑦，𝐿表示神经网络层数，𝑆𝐼表示每层的 neuron 个数(𝑆𝑙表示输出层神经元个数)，𝑆𝐿代表最后一层中处理单元。
在这里插入图片描述
在神经网络中，我们可以有很多输出变量，我们的ℎ𝜃(𝑥)是一个维度为𝐾的向量。

唯一不同的是，对于每一行特征，我们都会给出𝐾个预测，基本上我们可以利用循环，对每一行特征都预测𝐾个不同结果，然后在利用循环在𝐾个预测中选择可能性最高的一个，将其与𝑦中的实际数据进行比较。

9.2反向传播算法

在计算神经网络预测结果的时候我们采用了一种正向传播方法，
为了计算代价函数的偏导数：在这里插入图片描述我们需要采用一种反向传播算法，

我们从最后一层的误差开始计算，误差是激活单元的预测（a_k(4)）与实际值（𝑦^𝑘）之间的误差，（𝑘 = 1: 𝑘）。
在这里插入图片描述
𝑙 代表目前所计算的是第几层。
𝑗 代表目前计算层中的激活单元的下标，也将是下一层的第𝑗个输入变量的下标。
𝑖 代表下一层中误差单元的下标，是受到权重矩阵中第𝑖行影响的下一层中的误差单元的下标。
我们用𝛥_𝑖𝑗^(𝑙)来表示这个误差矩阵。第 𝑙 层的第 𝑖 个激活单元受到第 𝑗个参数影响而导致的误差。在这里插入图片描述
即首先用正向传播方法计算出每一层的激活单元，利用训练集的结果与神经网络预测的结果求出最后一层的误差，然后利用该误差运用反向传播法计算出直至第二层的所有误差。
在求出了𝛥_𝑖𝑗^(𝑙)之后，我们便可以计算代价函数的偏导数了。在这里插入图片描述
在 Octave 中，我们要使用 fminuc 这样的优化算法来求解求出权重矩阵。

9.3反向传播算法的直观理解

在这里插入图片描述

9.4实现注意：展开参数

在这里插入图片描述

9.5梯度检验

梯度的数值检验，通过估计梯度值来检验我们计算的导数值是否真的是我们要求的。在代价函数上沿着切线的方向选择离两个非常近的点然后计算两个点的平均值用以估计梯度。𝜀是一个非常小的值，通常选取 0.001。
在这里插入图片描述

最后我们还需要对通过反向传播方法计算出的偏导数进行检验。
我们针对每一个 𝜃 都计算一个近似的梯度值，将这些值存储于一个近似梯度矩阵中，最终将得出的这个矩阵同 𝐷_𝑖𝑗(𝑙) 进行比较。