【机器学习】神经网络

HP-Patience

已于 2024-07-11 21:47:28 修改

阅读量998

点赞数 15

分类专栏：机器学习-西瓜书-学习笔记文章标签：神经网络人工智能深度学习

于 2024-06-13 20:12:41 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_82023330/article/details/139663281

版权

机器学习-西瓜书-学习笔记专栏收录该内容

7 篇文章 0 订阅

订阅专栏

文章目录

神经网络模型
万有逼近能力
- - 名词概念：
  - 引入原因：
BP算法
缓解过拟合
- 1.早停(early stopping)
- 2.正则化(regularization)

神经网络模型

1943年一直沿用至今的M-P神经网络模型

M-P神经网络模型

模型解释：

将输入神经元的x乘上相应权重w并求和，将结果与阈值 $\theta$ 做差，再经过激活函数f得到输出值y

名词解释：

阈值(threshold / bias):
表示神经元电位超过阈值则被激活

激活函数(activation function)：
也称挤压函数或响应函数，用于将输入值映射为0/1或(0，1)

训练目标：

通过训练模型，得出合适的w和 $\theta$ ，其中训练算法最常见的就是下面会说到的BP算法

在这里插入图片描述

激活函数

回顾第三章线性模型中的对数几率回归模型和单位阶跃函数

最理想状态是用单位阶跃函数输入值映射为0/1，但由于其不连续、不光滑的性质，
我们使用Sigmoid函数将输入值映射为(0，1)，Sigmoid函数即型为S的函数，其中我们最常用的就是对数几率函数：
$\frac { 1 } { 1 + e ^ { - x } }$
对率函数有很好的性质： $\prime } ( x ) = f \left( x \right) ( 1 - f \left( x \right) )$

万有逼近能力

名词概念：

仅需一个包含足够多神经元的隐层，多层前馈神经网络就能以任意精度逼近任意复杂度的连续函数

引入原因：

很多算法都具有万有逼近能力，不是神经网络所特有的，如决策树、支持向量机等等。
而之所以在神经网络中强调其万有逼近能力，是因为其数学公理方面的理论薄弱，为了证明其有效性而进行说明。

BP算法

误差逆传播(error BackPropagation，简称BP)算法，亦称反向传播算法

BP算法是一种迭代算法，基于梯度下降(gradient descent)策略，
数学推导过程不多做阐述，详见西瓜书or南瓜书

在这里插入图片描述

缓解过拟合

由于神经网络强大的表示能力，其经常容易过拟合，为此我们有以下两种策略

1.早停(early stopping)

将数据集分为训练集和验证集，若验证集得到的误差升高，则停止训练。

但是很显然神经网络的误差可能是细微的波动，但却造成了训练的停止，有点像决策树中的预剪枝，基于贪心的策略。

所以采用：

若训练误差连续α轮的变化小于b，则停止训练使用验证集
若训练误差降低、验证误差升高，则停止训练

2.正则化(regularization)

在误差目标函数中增加一项描述网络复杂度

$\lambda \frac { 1 } { m } \sum _ { k = 1 } ^ { m } E _ { k } + ( 1 - \lambda ) \sum _ { i } w _ { i } ^ { 2 }$

偏好比较小的连接权和阀值，使网络输出更“光滑”

关注

15
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
【机器学习】神经网络

机器学习-西瓜书-🍉Book-5章-神经网络
复制链接

扫一扫

专栏目录

HP-Patience CSDN认证博客专家 CSDN认证企业博客

码龄1年

18: 原创

4万+: 周排名

4万+: 总排名

1万+: 访问

: 等级

496: 积分

238: 粉丝

285: 获赞

4: 评论

272: 收藏

私信

关注

热门文章

分类专栏

最新评论

论文阅读-Baseline与Benchmark介绍
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
统计学-时间序列(Part 1)-时间序列概述
CSDN-Ada助手: 恭喜您在统计学领域写下了第7篇博客，标题为“时间序列概述”，内容一定十分精彩。希望您能继续保持创作的热情和耐心，为读者带来更多有价值的内容。下一步可以考虑深入探讨时间序列分析的具体方法和应用场景，让读者更加深入地了解这一领域。期待您的更多精彩文章，加油！
【机器学习】模型评估与选择(Part 1)
CSDN-Ada助手: 恭喜你写完了第5篇博客！看到你对西瓜书第2章的模型评估与选择有深入的了解，让我感到十分欣慰。接下来，我建议你可以继续深入学习和探索，比如可以尝试结合实际案例来分析模型评估的实际应用，或者挑选一些经典的算法进行比较和评估。希望你能继续保持热情，不断进步，期待你更多精彩的创作！
ACM算法竞赛---学习路线---中级
CSDN-Ada助手: 非常感谢您分享这篇关于ACM算法竞赛学习路线的中级内容！您的博文内容涵盖了许多算法和技术，让读者可以系统地学习和提高自己的算法竞赛能力。除了您提到的内容，我还想分享一些扩展知识，比如动态规划、网络流算法、字符串算法等，它们在ACM算法竞赛中也非常重要。希望您可以继续写下去，分享更多精彩的内容，让更多人受益！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
ACM算法竞赛---学习路线---初级
CSDN-Ada助手: 恭喜你开始博客创作！标题中的“ACM算法竞赛---学习路线”听起来非常有趣和有价值。作为一个新的博主，你选择了一个受欢迎且有挑战性的主题。我期待着读到你的博客，了解你的学习路线和经验分享。在你的下一步创作中，我建议你可以根据自己的学习经验，分享一些实用的学习方法和技巧。这将有助于那些刚开始学习ACM算法竞赛的读者更好地入门和提高。同时，你也可以在博客中引用一些经典的ACM竞赛题目，讲解解题思路和技巧，给读者提供更多的实战经验。祝愿你的博客越来越好，期待你的下一篇文章！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。