机器学习笔记（七）-神经网络：学习

997and

已于 2022-07-13 20:42:02 修改

阅读量413

点赞数

分类专栏：机器学习文章标签：机器学习神经网络深度学习

于 2022-02-08 16:55:20 首次发布

本文链接：https://blog.csdn.net/zxq997997/article/details/120493873

版权

机器学习专栏收录该内容

16 篇文章 0 订阅

订阅专栏

本次学习笔记主要记录学习机器学习时的各种记录，包括吴恩达老师视频学习、李宏毅老师视频学习、周志华老师的《机器学习》（西瓜书）以及李航老师的《统计学习方法》。作者能力有限，如有错误等，望联系修改，非常感谢！

第一版 2022-02-08 初稿

一、代价函数

在这里插入图片描述
假设神经网络的训练样本有m个，每个包含一组输入x和一组输出信号y，S_L表示最后一层中处理单元的个数。
二元分类：S_L=0 , y=0 or 1表示哪一类；
K类分类：S_L=k , y_i=1表示分到第i类；(k>2)

下边复杂的代价函数思想是一样的，希望通过代价函数来观察算法预测的结果与真实情况的误差有多大，唯一不同是，对于每一行特征，都会给出K个预测，基本上我们可以利用循环，对每一行特征都预测K个不同结果，然后再利用循环在K个预测中选择可能性最高的一个，将其与y中的实际数据进行比较。
正则化的那一项只是排除了每一层θ_0后，每一层的θ矩阵的和。最里层的循环j循环所有的行（由s_l+1 层的激活单元数決定），循环 i 则循环所有的列，由该层（S_l层）的激活单元数所决定。即：h_θ(x)与真实值之间的距离为每个样本-每个类输出的加和，对参数进行regularization 的bias 项处理所有参数的平方和。

二、反向传播算法

在这里插入图片描述
现在，为了计算代价函数的偏导数 $\frac{\partial}{\partial \varTheta _{ij}^{\left( l \right)}}J\left( \varTheta \right)$ ，我们需要采用一种反向传播算法，也就是首先计算最后一层的误差，然后再一层一层反向求出各层的误差，直到倒数第二层。以一个例子来说明反向传播算法。
在这里插入图片描述
l代表目前所计算的是第几层；
j代表目前计算层中的激活单元的下标，也将是下一层的第j个输入变量的下标；
i代表下一层中误差单元的下标，是受到权重矩阵中第i行影响的下一层中的误差单元的下标。
在这里插入图片描述