反向传播算法（back propagation）

最新推荐文章于 2024-08-23 07:00:00 发布

autocyz

最新推荐文章于 2024-08-23 07:00:00 发布

阅读量6.2k

点赞数 4

分类专栏：机器学习深度学习视觉机器学习文章标签：神经网络反向传播 backpropag

本文链接：https://blog.csdn.net/autocyz/article/details/51614178

版权

本文深入探讨反向传播算法在多层神经网络训练中的作用，详细阐述了前馈神经网络的基本概念，并逐步推导了反向传播算法的过程。通过前馈神经网络的信息传递，反向传播旨在优化权重参数和偏置参数，以提高神经网络的性能。在训练过程中，算法分为前馈计算、误差反向传播和参数更新三个关键步骤。

摘要由CSDN通过智能技术生成

反向传播算法是多层神经网络的训练中举足轻重的算法，本文着重讲解方向传播算法的原理和推导过程。因此对于一些基本的神经网络的知识，本文不做介绍。在理解反向传播算法前，先要理解神经网络中的前馈神经网络算法。

前馈神经网络

如下图，是一个多层神经网络的简单示意图：
这里写图片描述
给定一个前馈神经网络，我们用下面的记号来描述这个网络：
$L$ ：表示神经网络的层数；
$n^l$ ：表示第 $l$ 层神经元的个数；
$f_l(\bullet)$ ：表示 $l$ 层神经元的激活函数；
$W^l\in R^{n^l\times n^{l-1}}$ ：表示 $l-1$ 层到第 $l$ 层的权重矩阵；
$b^l\in R^{n^l}$ ：表示 $l-1$ 层到 $l$ 层的偏置；
$z^l\in R^{n^l}$ ：表示第 $l$ 层神经元的输入；
$a^l\in R^{n^l}$ ：表示第 $l$ 层神经元的输出；

前馈神经网络通过如下的公式进行信息传播：

z l = W l \cdot a l - 1 + b l a l = f l (z l)

$z^l=W^l \cdot a^{l-1}+b^l \\ a^l=f_l(z^l)$ 上述两个公式可以合并写成如下形式：

z l = W l \cdot f l (z l - 1) + b l

$z^l=W^l \cdot f_l(z^{l-1})+b^l$ 这样通过一层一层的信息传递，可以得到网络的最后输出

y $y$ 为：

x = a 0 \to z 1 \to a 1 \to z 1 \to \dots \to a L - 1 \to z L \to a L = y

$x=a^0\rightarrow z^1\rightarrow a^1\rightarrow z^1\rightarrow \cdots \rightarrow a^{L-1} \rightarrow z^L \rightarrow a^L=y$

反向传播算法

在了解前馈神经网络的结构之后，我们一前馈神经网络的信息传递过程为基础，从而推到反向传播算法。首先要明确一点，反向传播算法是为了更好更快的训练前馈神经网络，得到神经网络每一层的权重参数和偏置参数。
在推导反向传播的理论之前，首先看一幅能够直观的反映反向传播过程的图，这个图取材于Principles of training multi-layer neural network using backpropagation。如果图中看不清可以去源地址看。
这里写图片描述