elman神经网络_西瓜书第五章——神经网络

5.1 神经元模型

定义:神经网络是具有适应性的简单单元组成的广泛并行互联的网络,他的组织能够模拟生物神经系统对真实世界所做出的交互反应

dff625a836a6b54f966c25b786304eab.png

5.2 感知机与多层网络

*感知机由两层神经元组成

feb15161eb8edea1910bfecf5b5c8d4b.png

bb2ac116a48c97f63b9719a5fb056715.png

感知机只能解决a-c的问题,对于异或等非线性问题无法解决。

5.3误差逆传播算法(反向传播算法BP)

0f02d4919c63dc4cb7017a397f9fc448.png

那对于训练例(xk,yk)假定输出:

b8d2e27a82815e00e65140196ada4405.png

则均方误差为

7408143835d3e740e74d355b8be3ea62.png

BP算法基于梯度下降策略,给定一个学习率

08d7d08356079c2adac8fdb98ec11f20.png

根据链式法则

19074e4f924c0b7645d19c8c72bfedbd.png

25737e46e820b22724cc40242809b550.png

sigmoid函数具有:

7595d4b3845c915b06aa1ca535a3c6f3.png

根据5.3,5.4就有:

0fa359379829a476c3f90d9d23b39366.png

将5.10和5.8式带入到5.7,再带入到5.6,就有BP算法中关于w更新公式:

d421c8107b89bb99a7cb143b93ddf414.png

类似可得到:

学习率控制着算法的每一轮迭代更新,太大容易振荡,太小收敛过慢

e72a68b75557cb73916d5909d637681a.png

其中:

01ce37b00e51bffa6550144845496c22.png

add4743c3f13037a24eeebb94f819e34.png

BP算法工作流程

a144d75902b4c6616b962f1e193ab2a3.png

其目的在于最小化训练集上的累计误差:

933d2480f413f5f16aef97291c17eff4.png

*一般来说,标准BP算法每次更新值针对单个样例,参数更新的很频繁。

累计BP算法直接针对累积误差最小化,他读取完整个训练集之后才对参数进行更新。

BP算法存在过拟合问题,目前也有很多关于这一问题的解决方案。

5.4 全局最小和局部极小5.5 其他常见神经网络

  • RBF(径向基函数)网络
  • ART(自适应谐振理论)网络
  • SOM(自组织映射)网络
  • 级联相关网络
  • Elman网络(递归神经网络之一)
  • Boltzman机

5.6 深度学习

典型的深度学习就是指具有深层的神经网络。也即增加隐层数目

但是增加隐层的数目必然会导致阈值,权值的数目的增加,增加整个网络的学习负担

节省训练开销

权共享:让一组神经元使用相同的连接权。

比如CNN典型的手写数字识别网络

0dedfa7c7a25f7346acc3c36f6fe0f89.png
不论是卷积层还是采样层,每一组神经元都是使用的同一组权重
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值