人工神经网络的设计与实现（三） BP神经网络

最新推荐文章于 2022-09-28 20:53:10 发布

qwertyist

最新推荐文章于 2022-09-28 20:53:10 发布

阅读量1.1k

点赞数 2

分类专栏： ANN 文章标签： ANN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq923888674/article/details/50633583

版权

ANN 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

多层感知机模型

之前说单层的感知机模型不能处理线性不可分问题，多层感知机却可以成功胜任。下面再从异或入手解决问题。图片来源（自己动手写神经网络）。

如上图两层的感知机就能完成对XOR问题的正确划分。第一层的上侧是函数：2*p1+2*p2-1，下侧是函数-2*p1-2*p2+3，第二层是函数And就是与操作。可以得出它们对问题的划分如下：

即多层感知机把不能一次线性区分的问题分几次来解决，先解决分开解决各个部分再统一解决各个部分。有了这样的思路之后，关于神经网络的研究又开始如火如荼了。

BP神经网络

sigmoid函数

BP(Back Propagation)神经网络也是用的多层感知机模型，训练方法是误差逆传播，就是从输出层计算误差，反向向前传播，逐层修改连接权重的权值。
神经网络用的函数f是sigmoid函数(之前有说过)。

sigmoid函数把

映射到了（0,1），而且有个有意思的性质

，所以它的导数很容易求。我们为什么要把这个激励函数从普通的加权和换成sigmoid函数呢？因为BP算法要求导，sigmoid函数更加胜任。

BP算法

一个普通的三层BP网络如下所示

我们定义误差函数

其中outputs是网络中输出层单元的集合，是目标输出，是训练样本中第d个观测值在第k个输出单元的输出值。

我们BP的目的就是使误差函数E最小，理所当然地想到之前的梯度下降法，推导之前约定描述如下：

：单元j的第i个输入。

：与输入相关联的权值

：单元j的净输入（输入的加权和，未经过激励函数）。

：sigmoid函数。

：单元j的实际输出

outputs：输出层单元的集合。

Downstream(j)：上一层单元包含j的集合。

增量梯度下降算法中，对于每个训练样本中第 d 个观测的一个输入权重 w ij 的增量如下表示：

其中 E d 是训练样本中第 d 个观测的误差，通过对输出层所有单元的求和得到：

下面我们就要求梯度了（要分层求解，输出层，隐藏层），梯度向量中的各元素求解如下：

1 ）当单元 j 是一个输出单元时：

于是得到：

2 ）当单元 j 是一个隐藏层单元时，有如下推导：

实现

可以看到迭代到第932291代收敛了，可以区分异或问题了。第一次写net，写得不是很好，可以再改进改进，忘了wx+b的b了，加上估计会好点。

本人一边学，一边写，算给自己动力吧～～

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
人工神经网络的设计与实现（三） BP神经网络

多层感知机模型之前说单层的感知机模型不能处理线性不可分问题，多层感知机却可以成功胜任。下面再从异或入手解决问题。图片来源（自己动手写神经网络）。如上图两层的感知机就能完成对XOR问题的正确划分。第一层的上侧是函数：2*p1+2*p2-1，下侧是函数-2*p1-2*p2+3，第二层是函数And就是与操作。可以得出它们对问题的划分如下：即多层感知机把
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。