Datawhale X 李宏毅苹果书AI夏令营深度学习进阶笔记

最新推荐文章于 2024-08-27 23:27:54 发布

weixin_40251049

最新推荐文章于 2024-08-27 23:27:54 发布

阅读量171

点赞数 2

文章标签：人工智能深度学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40251049/article/details/141611858

版权

Datawhale X 李宏毅苹果书AI夏令营深度学习进阶笔记

1. 第三章深度学习基础

1. 第三章深度学习基础

局部极小值与鞍点

Motivation：梯度下降并为收敛到局部最优，但梯度已经为0，此时的情况就是鞍点。

判断临界值的方法：

将损失函数 $L(\theta)$ 泰勒展开；
在梯度为0时最后一项包含二次微分的海森矩阵H相关；
计算H的特征值，全正/负则为正/负定矩阵，一定是局部级小/大值，有正有负则为鞍点。

脱离鞍点的方法

Batch

在实际优化阶段，并不会每次计算全部数据的损失，而是分batch进行梯度下降。其中，batch size=1的时候叫做随机梯度下降。并行计算时大批量效率更高。需要引入一些随机性的时候可以减小batch size，引入一些噪声帮助训练。
随机梯度下降时脱离鞍点的方法之一。

动量法

Motivation：在原本的梯度下降方向之外，引入上一次梯度下降的方向类似惯性。这样前一步影响够大的时候会越过鞍点。

weixin_40251049

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Datawhale X 李宏毅苹果书AI夏令营深度学习进阶笔记

在实际优化阶段，并不会每次计算全部数据的损失，而是分batch进行梯度下降。其中，batch size=1的时候叫做随机梯度下降。并行计算时大批量效率更高。需要引入一些随机性的时候可以减小batch size，引入一些噪声帮助训练。Motivation：在原本的梯度下降方向之外，引入上一次梯度下降的方向类似惯性。这样前一步影响够大的时候会越过鞍点。Motivation：梯度下降并为收敛到局部最优，但梯度已经为0，此时的情况就是。随机梯度下降时脱离鞍点的方法之一。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。