elman神经网络_西瓜书第五章——神经网络

最新推荐文章于 2024-02-22 14:27:48 发布

weixin_39834406

最新推荐文章于 2024-02-22 14:27:48 发布

阅读量240

点赞数

文章标签： elman神经网络基于深层卷积网络的手写数字识别 minist

5.1 神经元模型

定义：神经网络是具有适应性的简单单元组成的广泛并行互联的网络，他的组织能够模拟生物神经系统对真实世界所做出的交互反应

5.2 感知机与多层网络

*感知机由两层神经元组成

感知机只能解决a-c的问题，对于异或等非线性问题无法解决。

5.3误差逆传播算法（反向传播算法BP）

那对于训练例（xk,yk)假定输出：

则均方误差为

BP算法基于梯度下降策略，给定一个学习率

根据链式法则

sigmoid函数具有：

根据5.3，5.4就有：

将5.10和5.8式带入到5.7，再带入到5.6，就有BP算法中关于w更新公式：

类似可得到：

学习率控制着算法的每一轮迭代更新，太大容易振荡，太小收敛过慢

其中：

BP算法工作流程

其目的在于最小化训练集上的累计误差：

*一般来说，标准BP算法每次更新值针对单个样例，参数更新的很频繁。

累计BP算法直接针对累积误差最小化，他读取完整个训练集之后才对参数进行更新。

BP算法存在过拟合问题，目前也有很多关于这一问题的解决方案。

5.4 全局最小和局部极小5.5 其他常见神经网络

RBF（径向基函数）网络
ART（自适应谐振理论）网络
SOM（自组织映射）网络
级联相关网络
Elman网络（递归神经网络之一）
Boltzman机

5.6 深度学习

典型的深度学习就是指具有深层的神经网络。也即增加隐层数目

但是增加隐层的数目必然会导致阈值，权值的数目的增加，增加整个网络的学习负担

节省训练开销

权共享：让一组神经元使用相同的连接权。

比如CNN典型的手写数字识别网络

不论是卷积层还是采样层，每一组神经元都是使用的同一组权重

weixin_39834406

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
elman神经网络_西瓜书第五章——神经网络

5.1 神经元模型定义：神经网络是具有适应性的简单单元组成的广泛并行互联的网络，他的组织能够模拟生物神经系统对真实世界所做出的交互反应5.2 感知机与多层网络*感知机由两层神经元组成感知机只能解决a-c的问题，对于异或等非线性问题无法解决。5.3误差逆传播算法（反向传播算法BP）那对于训练例（xk,yk)假定输出：则均方误差为BP算法基于梯度下降策略，给定一个学习率根据链式法则sigmoid函数具...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。