BP神经网络

最新推荐文章于 2019-06-30 16:07:05 发布

Lane Phoebe

最新推荐文章于 2019-06-30 16:07:05 发布

阅读量441

点赞数

分类专栏：机器学习实战文章标签：机器学习 BP神经算法网络详解

本文链接：https://blog.csdn.net/qq_25628891/article/details/82847649

版权

机器学习实战专栏收录该内容

15 篇文章 1 订阅

订阅专栏

意义
基本原理
结构图
激活函数（σ函数）
BP网络输入输出关系
BP网络的学习算法
–思想
– 学习过程
–学习本质
BP算法实现

意义：

通过比较简单的概念构建复杂的概念

基本原理：

利用输出后的误差来估计输出层的直接前导层的误差，再用这个误差估计更前一层的误差，如此一层一层的反传下去，就获得了所有其他各层的误差估计。

结构图:

在这里插入图片描述

激活函数

$\quad σ(w^T\vec x)是logistic \, signmod函数$
在这里插入图片描述
使用一组n个输入的 $x_{1}, x_{2},x_{3},x_{4},...,x_{n}$ 并将他们与一个输出y相关联。希望学习一组权重 $w_{1},w_{2},w_{3},w_{4},...,w_{n}$ 并计算他们的输出 $f(x,w)= net= x_{1}w_{1}+x_{2}w_{2}+...+x_{n}w_{n}$ 简单来说，就是根据每个类别的输入样本简单的返回函数f(x)本身的值来预测一个实数。

BP网络输入输出关系:

输入：

$f(x,w)= net= x_{1}w_{1}+x_{2}w_{2}+...+x_{n}w_{n}$

输出：

$\frac{1}{1+e^{-net}}$

输出的导数：

$\frac{1}{1+e^{-net}}-\frac{1}{{(1+e^{-net}})^2} = y(1-y)$

BP网络的学习算法

思想：

将输出误差以某种形式通过隐层向输入层逐层反传（即将误差分摊给各层的所有单元——各层单元的误差信号，以此来修正各单元权值）

学习过程：

神经网络在外界输入样本的刺激下不断改变网络的连接权值，以使网络的输出不断地接近期望的输出。信号的正向传播<—>误差的反向传播
在这里插入图片描述

学习本质：

对各连接权值的动态调整。常使用随机梯度下降法（SGD）调节权重

BP算法实现

网络结构：输入层n个输入神经元，隐含层有p个神经元，输出层有q个神经元（假设为3层网络，隐含层可拓展）
变量定义：
$\quad \quad\quad\quad\quad\quad \quad \quad \vec x = (x_{1},x_{2},x_{3},x_{4},...,x_{n}) \quad\,\,\\ 隐含层输入向量： \quad\quad\quad\quad\quad\vec {hi} = (hi_1,hi_2,hi_3,...,hi_p) \quad\\ 隐含层输出向量： \quad\quad\quad\quad\quad\vec {ho} = (ho_1,ho_2,ho_3,...,ho_p)\,\,\\ 输出层输入向量： \quad\quad\quad\quad\quad\vec {yi} = (yi_1,yi_2,yi_3,...,yi_q) \quad\\ 输出层输出向量： \quad\quad\quad\quad\quad\vec {yo} = (yo_1,yo_2,yo_3,...,yo_q)\,\,\\ 期望输出向量： \quad \quad\quad\quad\quad\quad \vec d = (d_{1},d_{2},d_{3},d_{4},...,d_{q}) \quad\,\,$

$\quad \quad \quad\quad \quad\quad \quad w_{ih} \quad \quad \quad \quad \\ 隐含层与输出层的连接权值：\quad \quad \quad \quad \quad \quad \quad w_{ho} \quad \quad \quad \quad \\ 隐含层各神经元的阈值： \quad \quad \quad\quad\quad \quad \quad \quad \quad b_{h} \quad\quad \quad \quad\,\,\, \\ 输出层各神经元的阈值： \quad \quad \quad\quad\quad \quad \quad \quad \quad b_{o} \quad\quad \quad \quad\,\,\,\, \\ 样本数据个数：\quad \quad \quad\quad\quad\quad\quad \quad \quad\quad\quad\quad \quad k=1,2,..m \,\,\\ 激活函数：\quad \quad \quad\quad\quad\quad\quad \quad \quad \quad\quad\quad\quad \quad \quad f(.) \quad\quad\quad\quad \\ 单个样本的训练误差:\quad \quad \quad\quad\quad\,\, E(k) = \frac{1}{2} \sum_{o=1}^q(d_{o}(k)-yo_{o}(k))^2\,\,\\ 误差函数：\quad \quad \quad E= \frac{1}{m} \sum_{k=1}^mE(k)= \frac{1}{2m} \sum_{k=1}^m\sum_{o=1}^q(d_{o}(k)-yo_{o}(k))^2\\$

step1：网络初始化

给各连接权值分别赋一个区间（-1,1）内的随机数，设定误差函数E，给定计算精度值ε和最大学习次数M。

step2：随机选取k个样本及其对应期望输出

$x(k) = (x_{1}(k),x_{2}(k),x_{3}(k),...,x_{n}(k)\\ d(k) = (d_{1}(k),d_{2}(k),d_{3}(k),...,d_{q}(k))$

step3：计算隐含层，输出层各神经元的输入和输出

$hi_{h}(k) = \sum_{j=1}^nw_{jh}x_{j}-b_{h}\quad\quad \quad \quad h =1,2,3,4...p\\ ho_{h}(k) = f( hi_{h}(k) ) \quad\quad\quad\quad\quad\quad h =1,2,3,4...p\\ yi_{o}(k) = \sum_{h=1}^pw_{ho}ho_{h}(k)-b_{o}\quad\quad \quad \quad o =1,2,3,4...q\\ yo_{o}(k) = f( yi_{o}(k) ) \quad\quad\quad\quad\quad\quad o =1,2,3,4...q\\$

step4：利用网络期望输出和实际输出，计算误差函数对输出层的各神经元的偏导数

$\frac{\partial E(k)}{\partial w_{ho}} = \frac{\partial E(k)}{\partial yi_{o}(k)} \frac{\partial yi_{o}(k)}{\partial w_{ho}}$
$1.\frac{\partial E(k)}{\partial yi_{o}(k)} = \frac{\partial(\frac{1}{2} \sum_{o=1}^q(d_{o}(k)-yo_{o}(k))^2)}{\partial yi_{o}(k)}= -\sum_{o=1}^q(d_{o}(k)-yo_{o}(k))yo_o'(k)\\= -\sum_{o=1}^q(d_{o}(k)-yo_{o}(k)) f'( yi_{o}(k)) = \delta_o(k)$
$2.\frac{\partial yi_{o}(k)}{\partial w_{ho}} = \frac{ \partial (\sum_{h=1}^pw_{ho}ho_{h}(k)-b_{o}(k))}{\partial w_{ho}} = ho_h(k)$ $总结：\frac{\partial E(k)}{\partial w_{ho}} = \delta_o(k) ho_h(k)$

step5：利用隐含层到输出层的连接权值、误差函数对输出层的各神经元的偏导数和隐含层的输出，计算误差函数对隐含层各神经元的偏导数

$\frac{\partial E(k)}{\partial w_{ih}} = \frac{\partial E(k)}{\partial hi_{h}(k)} \frac{\partial hi_{h}(k)}{\partial w_{ih}}$
$1.\frac{\partial E(k)}{\partial hi_{h}(k)} =\frac{\partial(\frac{1}{2} \sum_{o=1}^q(d_{o}(k)-yo_{o}(k))^2)}{\partial hi_{h}(k)}$ $=\frac{\partial(\frac{1}{2} \sum_{o=1}^q(d_{o}(k)-yo_{o}(k))^2)}{\partial ho_{h}(k)} \frac{\partial ho_h(k)}{\partial hi_{h}(k)}$ $=\frac{\partial(\frac{1}{2} \sum_{o=1}^q(d_{o}(k)- f( yi_{o}(k)))^2) }{\partial ho_{h}(k)} \frac{\partial ho_h(k)}{\partial hi_{h}(k)}$ $=\frac{\partial(\frac{1}{2} \sum_{o=1}^q(d_{o}(k)- f( \sum_{h=1}^pw_{ho}ho_{h}(k)-b_{o})))^2) }{\partial ho_{h}(k)} \frac{\partial ho_h(k)}{\partial hi_{h}(k)}$ $\sum_{o=1}^q(d_{o}(k)- f( yi_o(k)) f'(yi_o(k)) \frac{\partial ho_h(k)}{\partial hi_{h}(k)}$ $-\sum_{o=1}^q(d_{o}(k)- yo_o(k)) f'(yi_o(k))w_{ho} \frac{\partial ho_h(k)}{\partial hi_{h}(k)}$ $\sum_{h=1}^p\delta_o(k) w_{ho}.f'(hi_h(k))=\delta _h(k)$
$2.\frac{\partial hi_{h}(k)}{\partial w_{ih}} = \frac{\partial (\sum_{i=1}^nw_{oh}x_{i}-b_{h})}{\partial w_{ih}} = x_{i}(k)$
$总结：\frac{\partial E(k)}{\partial w_{ih}} = \delta_h(k) x_i(k)$

step6：利用输出层各神经元的偏导和隐含层各神经元的输出来修正连接权值(第四步结果)

$\Delta w_{ho} = -\mu \frac{\partial E(k)}{\partial w_{ho}} = \mu \delta_o(k)ho_h(k)\\ w_{ho^{N+1} = w_{ho}^N} + \mu \delta_o(k)ho_h(k)$

step7：同理，利用隐含层各神经元的偏导和输入层各神经元的输入参数来修正连接权值(第五步结果)

$\Delta w_{ih} = -\mu \frac{\partial E(k)}{\partial w_{ih}}= \mu \delta_h(k)x_i(k)\\ w_{ih^{N+1} = w_{ih}^N} + \mu \delta_h(k)x_i(k)$

step8：由误差函数计算全局误差

$\frac{1}{m} \sum_{k=1}^mE(k)= \frac{1}{2m} \sum_{k=1}^m\sum_{o=1}^q(d_{o}(k)-yo_{o}(k))^2$

step9：判断网络误差是否满足要求，判断网络误差是否满足要求。当误差达到预设精度或学习次数大于设定的最大次数，则结束算法。否则，选取下一个学习样本及对应的期望输出，返回到第三步，进入下一轮学习。

Lane Phoebe

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
BP神经网络

意义基本原理结构图激活函数（σ函数）意义：通过比较简单的概念构建复杂的概念基本原理：利用输出后的误差来估计输出层的直接前导层的误差，再用这个误差估计更前一层的误差，如此一层一层的反传下去，就获得了所有其他各层的误差估计。结构图:激活函数...
复制链接

扫一扫

专栏目录