【Datawhale X 李宏毅苹果书 AI夏令营】深度学习(进阶)&学习笔记

最新推荐文章于 2024-09-01 21:08:00 发布

Blizzarder_

最新推荐文章于 2024-09-01 21:08:00 发布

阅读量234

点赞数 9

文章标签：人工智能深度学习学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Blizzarder_/article/details/141614726

版权

3.1 局部极小值与鞍点

3.1.1 临界点及其种类

梯度下降失效: 梯度下降算法更新参数时，梯度 g 为零，导致参数不再更新，损失函数不再下降。
局部极小值: 周围的损失函数值都大于该点的损失函数值，是局部范围内的最低点。
鞍点: 周围的损失函数值既有大于该点的损失函数值，也有小于该点的损失函数值，形似马鞍，是局部范围内的“平坦”区域。
局部极大值: 周围的损失函数值都小于该点的损失函数值，是局部范围内的最高点。

3.1.2 判断临界值种类的方法

泰勒级数近似: 利用泰勒级数将损失函数在临界点附近展开，可以得到一个二次函数的近似，其中包含梯度 g 和海森矩阵 H 的信息。
梯度 g: 描述损失函数在临界点附近的斜率，可以帮助判断临界点的大致位置。
海森矩阵 H:
- 描述损失函数在临界点附近的曲率，可以更精确地判断临界点的种类。
- 计算特征值：
  - 所有特征值为正：局部极小值。
  - 所有特征值为负：局部极大值。
  - 特征值有正有负：鞍点。
计算复杂度: 计算海森矩阵的特征值需要大量计算，实际应用中可能采用近似方法或替代方案。

3.1.3 逃离鞍点的方法

高维空间中的鞍点: 低维空间中的局部极小值在高维空间中可能变成鞍点，因为高维空间中存在更多的路径可以逃离鞍点。
鞍点的处理:
- 利用海森矩阵的特征向量: 找到负的特征值对应的特征向量，沿着该方向更新参数，可以逃离鞍点。
- 其他方法: 由于计算海森矩阵的特征向量计算量较大，实际应用中可能采用其他方法，例如使用动量、学习率调度等技术。

补充知识点

局部极小值和鞍点的数量: 在高维空间中，局部极小值和鞍点的数量可能远大于局部极大值。
梯度下降算法的改进: 为了避免收敛到鞍点，可以采用一些改进的梯度下降算法，例如：
- Adam 优化器: 结合了动量和自适应学习率，可以更有效地逃离鞍点。
- Nesterov 加速梯度: 在计算梯度时加入一个预测项，可以更快地逃离鞍点。

关注

9
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
【Datawhale X 李宏毅苹果书 AI夏令营】深度学习(进阶)&学习笔记

3.1 局部极小值与鞍点3.1.1 临界点及其种类梯度下降失效: 梯度下降算法更新参数时，梯度 g 为零，导致参数不再更新，损失函数不再下降。局部极小值: 周围的损失函数值都大于该点的损失函数值，是局部范围内的最低点。鞍点: 周围的损失函数值既有大于该点的损失函数值，也有小于该点的损失函数值，形似马鞍，是局部范围内的“平坦”区域。局部极大值: 周围的损失函数值都小于该点的损失函数值，是局部范围内的最高点。3.1.2 判断临界值种类的方法泰勒级数近似: 利用泰勒级数将损失函数在临界点
复制链接

扫一扫

Blizzarder_ CSDN认证博客专家 CSDN认证企业博客

码龄2年

9: 原创

130万+: 周排名

11万+: 总排名

7316: 访问

: 等级

249: 积分

144: 粉丝

154: 获赞

9: 评论

136: 收藏

私信

关注

热门文章

分类专栏

最新评论

【一键办公】利用Python实现读取excel再对word文件批量替换
绕道走的大佬: 求志愿时长word的模板
蓝桥杯Python人的自我救赎——基础数据结构（3）
普通网友: 学到了，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
蓝桥杯Python人的自我救赎——基础数据结构（3）
普通网友: 引领技术潮流，是不可多得的好文，十分值得借鉴和参考。期待博主未来能够持续分享更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
【一键办公】利用Python实现读取excel再对word文件批量替换
CSDN-Ada助手: 恭喜作者能够利用Python实现读取excel再对word文件批量替换，这个技能对办公效率的提升肯定有很大帮助。希望作者能够继续分享更多的技术经验，比如可以结合Python实现其他办公自动化的功能，或者分享一些实用的小工具。期待作者的下一篇博客！
蓝桥杯Python人的自我救赎——基础数据结构（1）
CSDN-Ada助手: 恭喜用户写下了第四篇博客！标题看起来很有深意，希望能够看到更多关于蓝桥杯和Python的分享。建议在下一篇博客中继续探讨数据结构的应用，或者分享一些学习心得和技巧，期待您的更多精彩内容！加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。