BP神经网络

UESTC_C2_403

于 2017-07-10 09:25:50 发布

阅读量1.4w

点赞数 9

分类专栏：机器学习--ML 深度学习----Deep Learning

本文链接：https://blog.csdn.net/uestc_c2_403/article/details/74908410

版权

本文详细介绍了反向传播(BP)算法在多层神经网络中的工作原理，包括损失函数的定义、权值更新的计算以及算法的改进方法，如增加冲量项以改善局部极小值问题。同时，讨论了BP神经网络中隐含层节点数量的选择及其对性能的影响，并提出了防止过拟合的策略。最后，指出了标准BP神经网络的局限性，如局部极小值、收敛速度慢和隐含层选取等问题。

摘要由CSDN通过智能技术生成

反向传播算法又称BP算法（Back Propagation）

使用sigmoid函数(这是一个激励函数，对于不同的情况可以使用不同的激励函数，为了讲解方便，这里就采用这个激励函数来说明问题，其他的激励函数可以参考：http://blog.csdn.net/uestc_c2_403/article/details/73431428)的感知器来搭建一个多层神经网络，为简单起见，此处我们使用三层网络来分析。假设网络拓补如图1.1所示。

图1.1 BP网络拓补结构

　　网络的运行流程为：当输入一个样例后，获得该样例的特征向量，再根据权向量得到感知器的输入值，然后使用sigmoid函数计算出每个感知器的输出，再将此输出作为下一层感知器的输入，依次类推，直到输出层。

　　那么如何确定每个感知器的权向量呢？这时我们需要使用反向传播算法来逐步进行优化。后面在介绍

　　在上一篇介绍感知器的文章中，为了得到权向量，我们通过最小化损失函数来不断调整权向量。此方法也适用于此处求解权向量，首先我们需要定义损失函数(损失函数根据不同的情况需要使用不同的损失函数，为了方便这里使用平方误差的损失函数，这个函数适用于拟合数据，如果是分类，就用交叉熵损失函数)，由于网络的输出层有多个输出结点，我们需要将输出层每个输出结点的差值平方求和。于是得到每一个训练样例的损失函数为：（前面加个0.5方便后面求导使用）