《机器学习》——BP算法及式5.13的推导

最新推荐文章于 2023-09-28 20:32:41 发布

木樂_

最新推荐文章于 2023-09-28 20:32:41 发布

阅读量644

点赞数

文章标签：机器学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shaoyestillyoung/article/details/119003971

版权

BP算法及式5.13的推导

注:部分术语并不标准，仅是便于理解使用

文章目录

BP算法及式5.13的推导
1.概念
2.模型
- 2.1.参数解释
3.分类:
- 3.1标准BP算法
- 3.2.累积BP算法
4.BP与过拟合
5.迭代过程
6.式（5.13）的推导

1.概念

误差逆传播(error BackPropagation,简称BP)算法是用于训练多层网络的学习算法中最杰出的代表，它是迄今为止最成功的神经网络学习算法。
通常说BP网络时，指的是用BP算法训练的多层反馈神经网络。

2.模型

在这里插入图片描述

2.1.参数解释

输入层输出: x1~xd
输入层的输出与隐层的输入的关联函数: αh 的计算式即 v1h~vdh 的和
隐层第h个神经元的输入: αh
隐层第h个神经元的阈值: γh
隐层第h个神经元输入到输出的关联函数: f(αh-γh)
隐层输出: b1~bq
隐层的输出与输出层的输入的关联函数: βj 的计算式即 w1j~wqj 的和
输出层第j个神经元的输入: βj
输出层第j个神经元的阈值: θj
输出层第j个神经元输入到输出的关联函数: f(βj-θj)
输出层输出: y1-yl

3.分类:

3.1标准BP算法

每输入一个样例便更新一次参数。

3.2.累积BP算法

读取完整个训练集后再对参数进行更新。

(相比之下标准BP算法更好。)

4.BP与过拟合

4.1.解释

由于BP算法其强大的表示能力，BP算法经常遭遇过拟合。

(过拟合:当学习器把训练样本学的过多时，很可能把训练样本自身的一些特点当作了所有潜在样本会具有的一般性质，这样就会导致泛化性能下降，这种现象在机器学习中称为"过拟合"(overfitting).

4.2.解决方法:

4.2.1.早停

将数据分为训练集以及验证集，训练集用于计算梯度，更新参数，验证集用于计算误差，当训练集误差降低但验证集的误差却增高时，停止训练，返回有最小验证集误差的结果。

4.2.2.正则化

在误差目标函数中增加一用于描述网络复杂度的部分。（不太理解省略）

5.迭代过程

在这里插入图片描述

6.式（5.13）的推导

在这里插入图片描述

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。