【动手学习深度学习-----优化算法笔记】

最新推荐文章于 2023-11-19 08:35:48 发布

瞲_大河弯弯

最新推荐文章于 2023-11-19 08:35:48 发布

阅读量155

点赞数

分类专栏： NLP 文章标签：算法学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33950926/article/details/122997548

版权

NLP 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

优化和深度学习

优化算法的目标函数通常是基于训练数据集的损失函数，因此优化的目标是减少训练误差。

深度学习中的优化挑战

1.局部最小值

深度学习模型的目标函数通常有许多局部最优解。当优化问题的数值解接近局部最优值时，随着目标函数解的梯度接近或变为零，通过最终迭代获得的数值解可能仅使目标函数局部最优，而不是全局最优。只有一定程度的噪声可能会使参数超出局部最小值。事实上，这是小批量随机梯度下降的有利特性之一，在这种情况下，小批量上梯度的自然变化能够将参数从局部极小值中移出。
在这里插入图片描述

2.鞍点

鞍点（saddle point）是指函数的所有梯度都消失但既不是全局最小值也不是局部最小值的任何位置。
在这里插入图片描述
Hessian矩阵：设有凸函数f(X)，X是向量（x1,x2,…, xn)，Hessian矩阵M定义为：一个自变量为向量的实值函数的二阶偏导数组成的方块矩阵，也就是说M的第i行,第j列元素为df(X)/dxidxj, 即为f(X)对于变量xi和xj的二次偏导数。

当函数在零梯度位置处的Hessian矩阵的特征值全部为正值时，我们有该函数的局部最小值。
当函数在零梯度位置处的Hessian矩阵的特征值全部为负值时，我们有该函数的局部最大值。
当函数在零梯度位置处的Hessian矩阵的特征值为负值和正值时，我们对函数有一个鞍点。

对于高维度问题，至少部分特征值为负的可能性相当高。这使得鞍点比局部最小值更有可能。简而言之，凸函数是Hessian函数的特征值永远不是负值的函数。

梯度消失

这时候梯度接近于0
在这里插入图片描述

凸性

虽然深度学习中的优化问题通常是非凸的，它们也经常在局部极小值附近表现出一些凸性。
这一节看书吧。。

瞲_大河弯弯

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
【动手学习深度学习-----优化算法笔记】

优化和深度学习优化算法的目标函数通常是基于训练数据集的损失函数，因此优化的目标是减少训练误差。深度学习中的优化挑战1.局部最小值深度学习模型的目标函数通常有许多局部最优解。当优化问题的数值解接近局部最优值时，随着目标函数解的梯度接近或变为零，通过最终迭代获得的数值解可能仅使目标函数局部最优，而不是全局最优。只有一定程度的噪声可能会使参数超出局部最小值。事实上，这是小批量随机梯度下降的有利特性之一，在这种情况下，小批量上梯度的自然变化能够将参数从局部极小值中移出。2.鞍点鞍点（saddle po
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

瞲_大河弯弯 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。