Make Your Own Neural Network（十四）-----实际上是如何更新权重（二）

Make Your Own Neural Network

构建你自己的神经网络

https://blog.csdn.net/lz0499

作者：lz0499

声明：

1）Make Your Own Neural Network翻译自Tariq Rashid编写的神经网络入门书籍。作者的目的是尽可能的少用术语和高深的数学知识，以图文并茂的方式讲解神经网络是如何工作的。任何拥有高中数学水平的人就能够理解神经网络的工作方式。强烈推荐初学者以这本书作为神经网络入门书籍。

2）本文仅供学术交流，非商用。翻译的初衷是一边翻译一边加深对神经网络的理解。

3）由于刚刚接触神经网络这方面的知识，翻译过程中难免有些错误。若发现错误，还请各位前辈指正。谢谢！

4）由于工作原因，我将有选择的按照原文的章节不定期的进行翻译更新。

5）此属于第一版本，若有错误，还需继续修正与增删。

第一部分：神经网络是如何工作的

权重更新实例

实际上是如何更新权重（二）

神经网络的输出是一个包含非常多权重参数的复杂函数。我们能够使用梯度下降法求得其权重吗？只要我们能够使用正确的误差函数就可以求得出神经网络中权重的参数值。

神经网络的输出本身并不是一个误差函数。但是我们能够轻松的将它转换为误差函数，因为误差是训练样本目标值与神经网络输出值之间的差值。

如下表所示。下表标注了三个输出节点的训练值和实际的输出值，以及它们之间的误差值。

第一个候选误差函数非常简单，即目标值-实际输出值。这看起来很合理不是？如果我们以所有节点的误差和这个角度来度量神经网络训练的是否足够好，你将观察到其误差和为0！！

怎么回事？很明显，神经网络并没有被很好的训练，因为两个输出节点的值与目标值不一样，并且误差和为0意味着没有误差！！由于正负误差刚刚抵消了所以出现了误差和为0。即使误差没有完全的抵消，我们也可以观察到这是一种比较差的误差测量法。

让我们用实际输出值和目标值之间的绝对值来测量误差。这意味着我们将忽略符号，并即为|目标值-实际值|。最后误差求和时并没有完全的抵消。但是实际我们并不采用这种方法测量误差，因为在梯度下降法中靠近最小值的时候，其斜率并不是连续的，导致梯度下降法并不能很好的发挥作用。

第三种误差测量函数使用的是(目标值-实际值)的平方。我们采用这种函数测量误差主要是基于如下几点：

1.梯度下降法中求解斜率的时候比较容易。

2.这个误差函数时平滑而连续的，能够很好的发挥梯度下降法的优势

3.当靠近最小值的时候，梯度值越来越小。这意味着我们将使用平滑的步长靠近最小值，从而避免越过最小值的风险。

下面小节中我们将采用第三种误差测量函数。有人会问，有没有第四种误差测量函数呢？是的，当然有。你可以构建其他误差测量函数。有些不能很好的适用，有些只是针对特定的问题适用。

好了！在开始计算自变量是权重的误差函数之前，我们有些预备知识需要了解---微积分。你可能已经很熟悉微积分了，如果你不是很熟悉或者只是大概了解一些，本书的附录将包含一些这方面的介绍。微积分在数学上描述的是当一个变量变化时，另外一个变量将做如何变化。比如说，弹簧的长度改变时，弹簧的弹力将如何改变。对于神经网络而言，我们关心的是误差函数将随着权重的改变做何种改变。

让我们从一幅图画开始。