使用反向传播算法训练多层神经网络的原理【译】

最新推荐文章于 2022-08-30 16:33:42 发布

weixin_34128237

最新推荐文章于 2022-08-30 16:33:42 发布

阅读量331

点赞数

文章标签：人工智能

原文链接：https://juejin.im/post/5a927bae5188257a5911e2e8

版权

写在前面：之前写了一篇机器学习基本算法之神经网络里面涉及了一个重要算法，今天看到一篇关于这个算法的图示解释，所以打算翻译一下作为以后学习的一个参考。这是一篇关于反向传播算法的译文，译自 Principles of training multi-layer neural network using backpropagation。里面通过通俗易懂的图示方式介绍了神经网络中的前向和后向传播的整个过程。如果要深究其中原理和进行数学推导还是要参考其他资料，这篇文章中不涉及推理证明。图片来自原文，如果有侵权我会自行删除。

这篇文章描述了采用反向传播算法的多层神经网络的训练过程。为了说明这个过程，我们采用三层神经网络，两个输入一个输出作为示例。如下图所示：

每个神经元由两个单元组成。第一个单元是权重系数和输入型号的乘积和。第二个单元是实现非线性功能，这种功能叫做神经元激活。信号是加法器输出信号， y=f(e) 是非线性元素的输出信号。信号也是神经元的输出信号。

为了训练神经网络，我们需要训练数据集。训练数据集是由输入信号（ x_1 , x_2 ）和相应的正确目标（期望输出）组成的。训练网络是一个迭代的过程。在每一次迭代中，节点的权重系数都会被来自训练数据集中的新的数据修改。修改是通过下面描述的算法计算的：每次训练步骤开始都是强制使用来自训练集的数据作为输入数据。这个步骤之后，我们就能确定在每一个网络层的每一个神经元的输出信号的值。下面的图片显示了信号是怎么通过网络传播的，信号 $w_{(xm)n}$ 代表在网络输入 x_m 和在输入层的神经元之间连接的权重。信号 y_n 代表神经元的输出信号。