C++实现简单的反向传播算法(一)---理论部分

最新推荐文章于 2023-11-13 22:46:47 发布

还是要努力呀！

最新推荐文章于 2023-11-13 22:46:47 发布

阅读量972

点赞数 2

分类专栏：笔记 C++ 文章标签：神经网络 c++ 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33021529/article/details/115726954

版权

笔记同时被 2 个专栏收录

20 篇文章 3 订阅

订阅专栏

16 篇文章 1 订阅

订阅专栏

上周数据挖掘选修课老师要求我们自己尝试写一个反向传播的模型出来，我在CSDN上找了关于C++实现简单方向传播算法的相关内容，并结合老师课上内容成功实现了简单的反向传播神经网络，以此记录。

神经网络

神经网络最早是由心理学家和神经学家提出的,旨在寻求开发和测试神经的计算模拟；
神经网络是一组连接的输入/输出单元, 其中每个连接都与一个权相关联；
在学习阶段, 通过调整神经网络的权, 使得能够预测输入样本的正确类标记。

反向传播算法

误差反向传播算法简称反向传播算法(Back Propagation)。使用反向传播算法的多层感知器又称为 BP 神经网络。后向传播算法是在多层前馈(multilayer feed-forward)神经网络上学习的。一个多层前馈神经网络的模型如下图所示：在这里插入图片描述

训练样本 $X =\{x_1 ,x_2 ,..., x_i\}$ 馈入输入层.每层之间存在加权连接; 其中, $w_{ij}$ 表示由某层的单元j到前一层的单元 $i$ 的权；
隐藏层的数量是任意的, 实践中通常只用一层
输出层发布给定样本的网络预测
包含n个隐藏层的网络称作n+1层神经网络
网络是全连接的, 如果每个单元都向下一层的每个单元提供输入
给定足够多的隐藏单元, 线性阈值函数的多层前馈神经网络可以逼近任何函数

基本思想：

将训练集数据输入到神经网络的输入层，经过隐藏层，最后达到输出层并输出结果，这就是前向传播过程。
由于神经网络的输出结果与实际结果有误差，则计算估计值与实际值之间的误差，并将该误差从输出层向隐藏层反向传播，直至传播到输入层；
在反向传播的过程中，根据误差调整各种参数的值（相连神经元的权重），使得总损失函数减小。
迭代上述三个步骤（即对数据进行反复训练），直到满足停止准则。

步骤解释

初始化权：网络的权被初始化为很小的随机数 (例如, 由-1.0到1.0, 或由-0.5到0.5), 每个单元有一个偏置,
也类似地初始化为小随机数；
每个样本 $X$ 按以下步骤处理：
- 向前传播输入；
- 后向传播误差；
- 重复以上两步，直至终止条件满足。

测试问题

典型非线性问题XOR测试，即异或问题：两数相同时结果为0；两数不同时结果为1。

输入	输入	输出
0	0	0
0	1	1
1	0	1
1	1	0

前向传播

前向传播是将输入结点将由训练集获取到的输入值经过一系列操作依次从隐含层传递给输出层：
第 $j$ 层结点的当前值 $Value_j$ 是：
$Value_j = signod(\sum_i{Weight_{ij}Value_i +\theta_j})$

$Weight_{ij}$ 是由上一层的单元 $i$ 到单元 $j$ 的连接的权重；
$Value_i$ 是上一层的单元i的当前值；
$\theta_j$ 是单元 $j$ 的偏差(偏置值，用来改变单元的活性)；
$s i g m o d ()$ 函数是激活函数的一种，又称挤压函数，可以将一个较大的输入值域映射到较小的区间 $[0, 1]$ 里， $s i g m o d ()$ 的表达式如下： $\frac{1}{1+e^{-x}}$ 。

所以，一个隐含或输出单元 $j$ 的当前值是将前一层的当前值与对应的权重相乘以形成加权和，将加权和加到与单元 $j$ 想联的偏置值上，最后通过激活函数得到单元 $j$ 的当前值。
在这里插入图片描述

反向传播

我们通过前向传播会得到输出节点的预测值，这个预测值和测试集中输出结点的正确输出值是存在一定的误差，反向传播就是从输出层依次沿着隐含层、输入层传播这个误差，并更新每个结点的权值和反映网络预测误差的偏置值。

输出单元 $j$ 的误差 $Err_j$ 通过下式计算：
$Err_j=Value_j(1-Value_j)(RightOut_j - Value_j)$
其中：

$Value_j$ 是单元 $j$ 的当前值；
$RightOut_j$ 是训练集中给出的正确输出值；
$Value_j(1-Value_j)$ 是激活函数 $s i g m o d ()$ 的导数。

隐含单元 $j$ 的误差 $Err_j$ 通过下式计算：
$Err_j=Value_j(1-Value_j)\sum_k{Weight_{jk}{Err_k}}$
其中，

$Weight_{jk}$ 是由下一较高层中单元 $k$ 到单元j的连接权;
$Err_k$ 单元 $k$ 的误差

更新权值：

$\Delta Weight_{ij} = l \ast Err_j \ast Value_j \\ Weight_{ij} = Weight_{ij} + \Delta Weight_{ij}$

其中，

$\Delta Weight_{ij}$ 是 $Weight_{ij}$ 的改变；
变量 $l$ 是学习率，通常取0和1之间的值；
- 学习率帮助避免陷入判定空间的局部最小
- 学习率调整规则：将学习率设置为 $1 / t$ ，其中 $t$ 是对训练样本迭代的次数。

更新偏置值：

$\Delta \theta_j = l \ast Err_j \\ \theta_j = \theta_j + \Delta \theta_j$

其中， $\Delta \theta_j$ 是偏置值 $\theta_j$ 的改变。

实例更新&周期更新

实例更新(case update)：每处理一个样本就更新权值和偏置值；
周期更新(epoch update)：处理完训练集中的所有样本之后再更新权值和偏置值。

终止条件

前一周期所有的 $\Delta Weight_{ij}$ 都小于某个指定的阈值；
前一周期未正确分类的样本百分百小于某个阈值；
超过预先指定的周期数(实践中，权值收敛可能需要数十万个周期)。

还是要努力呀！

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。