基于误差反传的多层感知器——BP神经网络

最新推荐文章于 2024-04-25 20:48:26 发布

Sunny_Jie

最新推荐文章于 2024-04-25 20:48:26 发布

阅读量1.1k

点赞数 1

分类专栏：机器学习数学原理文章标签： BP算法 BP网络模型感知器

本文链接：https://blog.csdn.net/qq_35866736/article/details/96146536

版权

郑重声明：以下内容，完全参考韩力群编著的《人工神经网络理论，设计及应用》

BP算法的基本思想是，学习过程由信号的正向传播与误差的反向传播两个过程组成。

1. BP网络模型

我们以单隐层感知器为例进行BP网络模型的说明，一般习惯将单隐层感知器称为三层感知器，所谓三层包括了输入层，隐层和输出层。
三层感知器中，输入向量为 $\bm X=(x_1,x_2,\cdots,x_i,\cdots,x_n)^T$ ，图中 $x_0=-1$ 是为隐层神经元引入阈值而设置的；隐层输出向量为 $\bm Y=(y_1,y_2,\cdots,y_j,\cdots,y_m)^T$ ，图中 $y_0=-1$ 是为输出层神经元引入阈值而设置的；输出层的向量为 $\bm O=(o_1,o_2,\cdots,o_k,\cdots,o_l)^T$ ；期望输出向量为 $\bm d=(d_1,d_2,\cdots,d_k,\cdots,d_l)^T$ 。

输入层到隐层之间的权值矩阵用 $\bm V$ 表示， $\bm V=(\bm V_1,\bm V_2,\cdots,\bm V_j,\cdots,\bm V_m)$ ，其中列向量 $\bm V_j$ 为隐层第 $j$ 个神经元对应的权向量，隐层到输出层之间的权值矩阵用 $\bm W$ 表示， $\bm W=(\bm W_1,\bm W_2,\cdots,\bm W_k,\cdots,\bm W_l)$ ，其中列向量 $\bm W_k$ 为输出层第 $k$ 个神经元对应的权向量。
下面分析各层信号之间的数学关系。

对于输出层，有：
$o_k=f({\rm net}_k)\quad\quad k=1,2,\cdots,l \tag{1.1}$ ${\rm net}_k=\sum^m_{j=0}w_{jk}y_j\quad k=1,2,\cdots,l \tag{1.2}$ 对于隐层，有：
$y_i=f({\rm net}_j)\quad\quad j=1,2,\cdots,m\tag{1.3}$ ${\rm net}_j=\sum^n_{i=0}v_{ij}x_i\quad j=1,2,\cdots,m\tag{1.4}$ 以上两式中，激活函数（转移函数） $f (x)$ 均为单极性Sigmoid函数：

$f(x)=\frac{1}{1+{\rm e}^{-x}}\tag{1.5}$ $f (x)$ 具有连续、可导的特点，且有：
$f'(x)=f(x)(1-f(x))\tag{1.6}$ 根据需要，也可以采用双极性Sigmoid函数（或称双曲线正切函数）：
$f(x)=\frac{1-{\rm e}^{-x}}{1+{\rm e}^{-x}}\tag{1.7}$ 式(1.1) ~ (1.5)共同构成了三层感知器的数学模型。

2. BP学习算法

下面一三层感知器为例介绍BP学习算法，然后将所得结论推广到一般多层感知器的情况。

2.1 网络误差定义和权值调整思路

在进行下面推导的过程中，我们必须要重视以下符号的含义:

$w_{jk}^h$ ：表示第 $h - 1$ 隐层第 $j$ 个神经元的输出值 传递到第 $h$ 隐层第 $k$ 个神经元时的缩放比例，称之为权值。
$y^h_j$ ：表示第 $h$ 隐层第 $j$ 个神经元的输出值，也是 $h + 1$ 层神经元d 输入值经过权重 $w_{jk}^{h+1}$ 缩放后的一部分。
${\rm net}_j^h$ ：表示第 $h$ 隐层第 $j$ 个神经元的集结输入值， ${\rm net}_j^h=\sum^m_{j=0}w^h_{ij}y^{h-1}_i$ 。
$f({\rm net}_j^h)$ ：表示第 $h$ 隐层第 $j$ 个神经元的激活函数（转移函数）,即： $y_j^h=f({\rm net}_j^h)$
$\delta^h_j$ ：表示第 $h$ 隐层第 $j$ 个神经元的输出误差信号，也称为学习信号，这是因为网络误差函数 $E$ 对第 $h$ 隐层第 $j$ 个神经元的

最低0.47元/天解锁文章

Sunny_Jie

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
基于误差反传的多层感知器——BP神经网络

BP算法的基本思想是，学习过程由信号的正向传播与误差的反向传播两个过程组成。1. BP网络模型我们以单隐层感知器为例进行BP网络模型的说明，一般习惯将单隐层感知器称为三层感知器，所谓三层包括了输入层，隐层和输出层。三层感知器中，输入向量为X=(x1,x2,⋯&ThinSpace;,xi,⋯&ThinSpace;,xn)T\bm X=(x_1,x_2,\cdots,x_i,...
复制链接

扫一扫