Datawhale X 李宏毅苹果书AI夏令营

顾璃95

已于 2024-08-27 21:40:03 修改

阅读量382

点赞数 10

分类专栏：深度学习文章标签：深度学习

于 2024-08-27 21:38:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_68154661/article/details/141612810

版权

深度学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

第3章深度学习基础

3.1 局部极小值与鞍点

优化问题：

深度学习中优化神经网络时，可能会遇到优化失败的情况，如收敛在局部极小值或鞍点。

临界点：

局部极小值：梯度为零且周围损失都较高的点。
-
鞍点：梯度为零但不是局部极小值或局部极大值的点，形状类似马鞍。
-
局部极大值：梯度为零且周围损失都较低的点。
-

判断临界点种类：

通过泰勒级数近似和海森矩阵（Hessian matrix）来判断临界点的类型。

在这里插入图片描述
海森矩阵的特征值： - 所有特征值正：正定矩阵，临界点为局部极小值。

所有特征值负：负定矩阵，临界点为局部极大值。
特征值有正有负：临界点为鞍点。

在实际应用中，直接计算海森矩阵可能非常昂贵，因为它涉及到损失函数的二阶导数，并且计算复杂度随着参数数量的增加而呈平方增长。因此，人们通常寻找更高效的算法来近似或直接利用一阶导数信息进行优化，如使用梯度下降法、牛顿法或拟牛顿法等。尽管如此，理解泰勒级数近似和海森矩阵的概念对于深入理解优化过程仍然非常重要。

逃离鞍点的方法：

通过海森矩阵的特征向量和特征值来更新参数，逃离鞍点。
实际应用中，直接计算海森矩阵并不常见，因为计算量大，通常使用其他方法。

鞍点与局部极小值的普遍性：

在高维参数空间中，局部极小值可能并不常见，而鞍点可能更为普遍。
实验表明，大多数情况下，训练过程中遇到的临界点更可能是鞍点而非局部极小值。

实验观察：

通过训练不同神经网络的实验，观察到最小值比例（正特征值数量与总特征值数量的比）通常不高，表明鞍点比局部极小值更常见。

结论：

在深度学习中，优化过程中遇到鞍点是常见的，而局部极小值则相对较少。
优化策略需要考虑如何有效逃离鞍点，以继续降低损失函数的值。

关注

10
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

顾璃95 CSDN认证博客专家 CSDN认证企业博客

码龄3年

7: 原创

78万+: 周排名

13万+: 总排名

2412: 访问

: 等级

92: 积分

20: 粉丝

22: 获赞

4: 评论

20: 收藏

私信

关注

热门文章

分类专栏

深度学习 2篇
数据结构 2篇

最新评论

Datawhale X 李宏毅苹果书AI夏令营（2）
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
数据分析入门——数据的载入与pandas基础
CSDN-Ada助手: 恭喜作者发布了新的博客，对数据分析入门的内容进行了深入的探讨，尤其是数据的载入与pandas基础的讲解非常详细。希望作者可以继续坚持创作，分享更多关于数据分析的知识和经验。下一步可以考虑结合实际案例，或者深入探讨数据分析中的一些具体技术或工具的使用方法，让读者能够更好地理解和应用。期待作者更多精彩的作品！
《计算之魂》——引言2
CSDN-Ada助手: 恭喜用户又发表了一篇名为《计算之魂》的博客！您的创作热情令人钦佩，也让我们读者能够不断学习。希望您能继续保持创作的激情，让我们在您的博客中不断汲取知识。接下来，建议您可以更深入地探究《计算之魂》的相关内容，挖掘更多的知识点，让我们读者有更广阔的视野。期待您的下一篇作品！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
《计算之魂》阅读——引言
CSDN-Ada助手: 恭喜您写了第三篇博客！阅读《计算之魂》的引言，不仅能够增加我们的知识，更能够激发我们对计算机科学的热爱。希望您能够继续保持创作的热情，分享更多有价值的文章。下一步的创作建议是多挖掘一些实用的计算机技巧，让读者可以从您的博客中获得更多的实践经验。期待您的下一篇文章！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
数据结构之链表
CSDN-Ada助手: 很棒的博客！看到你对链表结构的深入理解，让我感到非常欣慰。希望你能坚持写作，分享更多有用的知识。此外，对于链表的应用，你是否了解过LRU缓存算法？它是一种基于链表的缓存淘汰算法，可以有效地管理缓存空间。希望这能对你的学习和实践有所启发。如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。