神经网络与误差反向传播算法

最新推荐文章于 2023-04-10 17:00:00 发布

鹿衔草啊

最新推荐文章于 2023-04-10 17:00:00 发布

阅读量1.1k

点赞数

文章标签：神经网络算法深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45649258/article/details/124675629

版权

神经网络与误差反向传播算法

1 神经网络

1.1 神经网络

大量（结构简单的、功能接近的）神经元节点按一定体系架构连接成的网状结构——就是大脑的结构

1.2 神经网络的作用

分类、模式识别、连续值预测

1.3 神经元模型

每个神经元都是一个结构相似的独立单元，它接受前一层传来的数据，并将这些数据的加权和输入非线性作用函数中，最后将非线性作用函数中，最后将非线性作用函数的输出结果传递给后一层。
在这里插入图片描述

1.4 人工神经网络

基础神经网络
神经元：输入向量x；权重向量w；偏置标量b；激活函数sigmoid
在这里插入图片描述

浅网络：3-5层；优化；梯度下降；BP后向传播（链式规则）
在这里插入图片描述

1.5 前馈神经网络

前馈神经网络，是人工神经网络的一种，各神经元从输入层开始，接收前一级输入，并输出到下一级，直至输出层。整个网络中无反馈，可用一个有向无环图表示。
前馈神经网络采用一种单向多层结构。其中每一层包含若干个神经元，同一层的神经元之间没有互相连接，层间信息的传送只沿一个方向进行。
其中第一层称为输入层。最后一层为输出层.中间为隐含层。隐含层可以是一层，也可以是多层。

2 Delta学习规则

Delta学习规则是一种有监督学习算法，该算法根据神经元的实际输出与期望输出差别来调整连接权，其数学表示如下：
在这里插入图片描述

3 梯度

3.1 梯度下降

这是一个表示参数w与目标函数J（w）的关系图红色的部分是表示J（w）有着比较高的取值，需要能够让J（w）的值尽量的低。也就是深蓝色的部分。wl，w2表示w向量的两个维度。
在这里插入图片描述

先确定一个初始点，将w按照梯度下降的方向进行调整，就会使得J（w）往更低的方向进行变化

3.2 梯度下降示意

想象一下，你如何能在被蒙住眼睛的情况下，从山上走下来?
先用你灵巧的脚，探一探脚下的山地，哪个方向坡度最陡?（计算梯度方向）
朝着这个方向迈一步;（沿梯度方向下降）
一大步，还是一小步?（学习速率）
持续这个过程直到平地（迭代）
可不能有悬崖哦………（目标函数处处可导）

3.3 输出层权重改变量

在这里插入图片描述

3.4 隐藏层权重改变量

在这里插入图片描述

3.5 隐含层权重改变量

在这里插入图片描述

3.6 误差传播迭代公式

在这里插入图片描述

输出层和隐藏层的误差传播公式可统一为∶权重增量=-1学习步长目标函数对权重的偏导数
目标函数对权重的偏导数=-1残差当前层的输入残差= 当前层激励函数的导数*上层反传来的误差
上层反传来的误差=上层残差的加权和

3.7 隐藏层误差反向传播示意

在这里插入图片描述

4 简单的BP算例

举例：
在这里插入图片描述

5 典型的机器学习步骤

5.1 典型的机器学习的思路都是这样的

从开始的通过传感器来获取数据。然后经过预处理、特征提取、特征选择，再到推理、预测或者识别。最后一个部分，也就是机器学习的部分，绝大部分的工作是在这方面做的。
在这里插入图片描述

5.2 特征对学习的影响

一般而言，机器学习中特征越多，给出信息就越多，识别准确性会得到提升;
但特征多，计算复杂度增加，探索的空间就大，训练数据在全体特征向量中就会显得稀疏，影响相似性判断;
更重要的是，如果有对分类无益的特征，反而可能干扰学习效果
结论∶特征不一定越多越好，获得好的特征是识别成功的关键。需要有多少个特征，需要学习问题本身来决定。

6 深度学习的特征

深度学习，是一种基于无监督特征学习和特征层次结构的学习模型，其实是对神经网络模型的拓展。
在这里插入图片描述

6.1 “连接主义”的兴衰史

某种意义上说，AI的兴衰史，其实就是“连接主义”（感知机->神经网络->深度学习）的兴衰史
在这里插入图片描述

6.2 深度学习与神经网络的区别

在这里插入图片描述

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
4
评论
神经网络与误差反向传播算法

目录神经网络与误差反向传播算法1 神经网络1.1 神经网络1.2 神经网络的作用1.3 神经元模型1.4 人工神经网络1.5 前馈神经网络2 Delta学习规则3 梯度3.1 梯度下降3.2 梯度下降示意3.3 输出层权重改变量3.4 隐藏层权重改变量3.5 隐含层权重改变量3.6 误差传播迭代公式3.7 隐藏层误差反向传播示意4 简单的BP算例5 典型的机器学习步骤5.1 典型的机器学习的思路都是这样的5.2 特征对学习的影响6 深度学习的特征6.1 “连接主义”的兴衰史6.2 深度学习与神经网络的区别
复制链接

扫一扫

鹿衔草啊 CSDN认证博客专家 CSDN认证企业博客

码龄5年

99: 原创

30万+: 周排名

41万+: 总排名

9万+: 访问

: 等级

1027: 积分

46: 粉丝

29: 获赞

16: 评论

216: 收藏

私信

关注

热门文章

分类专栏

人工智能 3篇
深度学习 1篇

最新评论

肺部图像识别案例
鹿衔草啊: 这是我买的课，我花钱了，有资格用，这也是老师让这样写的，你不愿意看可以不看
肺部图像识别案例
cc8620: 偷别人东西你真好意思
手把手教你爬取网站信息
CSDN-Ada助手: 亲爱的博主，我真的非常欣赏和感激你用心撰写了这篇“手把手教你爬取网站信息”的博客。明白教授网站爬取技巧并不是一件容易的事情，你耐心而详细的解释让我对这个话题有了更深入的了解。你的用心和付出真的能够让读者受益匪浅。鉴于你的出色表现，我非常期待你下一篇可能创作的博客！我希望你可以写一篇关于如何分析和利用爬取到的数据的文章。我相信你的经验和见解可以在这个领域里为读者提供一些具有实际应用意义的技巧和方法。期待读到你的下一篇精彩分享！
机器学习-sklearn第一天——笔记
dtmyjt: 学长好，有个小问题想问一下，就是在您的倒数第二块和倒数第三块代码块中，您首先将整份样本固定划分为训练集和测试集，其中测试集占30%是ok的。再到后面的交叉验证部分就有点晕了感觉，正常流程的话我觉得应该是在训练集（70%）中进行K折交叉验证吧。。。（即70%中的9份进行train，1份进行validation，求一个train_score均值和test_score均值作为当前参数下的模型评分），而您好像每次都是拿固定的X_train和y_train在fit，交叉验证时却是把整体的样本X,y传入进行交叉验证，那么测试样本（30%）不是也有机会被fit了嘛...（来自机器学习小白的疑问
神经网络与误差反向传播算法
鹿衔草啊:

大家在看

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。