前馈神经网络原理与实现

最新推荐文章于 2024-06-28 18:43:11 发布

zealscott

最新推荐文章于 2024-06-28 18:43:11 发布

阅读量4.9k

点赞数 1

分类专栏：神经网络文章标签： BP神经网络 python

本文链接：https://blog.csdn.net/crazy_scott/article/details/79780904

版权

本文适用于已经对感知机、神经网络有初步了解，但上手比较困难，愿意推导公式，更深入了解神经网络的朋友。

引言

前馈神经网络是所有神经网络中最简单，也是最有效的一种。从单个神经元的角度看，不过就是设计权值与偏置的简单感知机运算。但到底网络是如何实现的？特别是back propagation的原理？我相信刚刚入门的很多朋友与我一样有很多疑惑，但又不想总是调包，那么我们就慢慢推导公式吧。

$w_{jk}^{l}$ :表示从 $（l-1）$ 层的第 $k$ 个神经元到第 $l$ 层的第 $j$ 个神经元的连接上的权重。虽然从直观上不太好理解为什么要这样表示（通常应该表示为 $w_{kj}^{l}$ ），但请先接受这种写法。可以对相邻两层的所有权重用矩阵的形式表示为 $w^l$ 。

$\sigma$ ：表示激活函数，本文都使用Sigmoid function。

$b_{j}^{l}$ ：表示第 $l$ 层 $j$ 神经元的偏置，可以对同一层的神经元表示为 $b^l$ ，记为偏置向量。

$a_{j}^l$ ：表示第 $l$ 层 $j$ 神经元的激活值，可以对同一层的神经元表示为 $a^l$ ，记为激活向量。
由BP神经网络的定义可得： $a^l = \sigma (w^la^{l-1}+b^l)$ 。

$z^l$ ：表示带权输入， $z^l = w^la^{l-1}+b^l\quad a^l = \sigma(z^l)$ 。

$C$ ：表示代价函数，定义为 $C = \frac {1}{2n} \sum ||y(x) - a^L(x)||^2$ ，其中 $y(x)$ 表示每个样本的真实输出， $L$ 表示神经网络的总层数。

BP神经网络的向前传播很简单，就使用之前提到的矩阵形式就可以计算，当我们初始化所有权重和偏置时，得到的结果输出与目标输出肯定有较大差距，我们使用代价函数来度量这种差距。定义如下：

C = \frac{1}{2 n} \sum | | y (x) - a^{L} (x) | |^{2}

$C = \frac {1}{2n} \sum ||y(x) - a^L(x)||^2$

那么，当输入和输出固定时， $C$ 就是关于 $w和b$ 的函数，我们需要对其进行求偏导，以此来更新代价函数。

我们需要对代价函数进行如下定义（假设）：

以下公式，不加说明， $C$ 都指特定的 $C_x$ 。

反向传播其实就是对权重和偏置变化影响函数过程的理解。最终就是需要计算 $\frac{\partial C}{\partial w_{jk}^{l}}和 \frac{\partial C}{\partial b_{j}^{l}}$ 。

我们首先定义一个中间量 $\delta_j^l = \frac{\partial C}{\partial z_{j}^{l}}$ ，表示为第 $l层第j$ 个神经元的误差，然后将 $\delta_j^l$ 关联到

关注

专栏目录