统计学习方法(第2版 P439~P440) 梯度下降法

最新推荐文章于 2024-09-14 20:23:55 发布

1_More_Step

最新推荐文章于 2024-09-14 20:23:55 发布

阅读量167

点赞数

分类专栏：梯度下降法文章标签：机器学习几何学

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a15261893837/article/details/111713439

版权

梯度下降法专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1、方向导数和梯度是什么关系？

假设函数连续可微；

1.1）在平面二维中，y=f(x)导数即某个点的切线,切线没有方向性的说法；

1.2）在三维中，z=f(x,y)中过某个点有无数条切线，每一条切线都有一个方向了，这个方向就是方向导数的方向向量；不同的方向导数大小不一样，最大的方向导数就是梯度；

在梯度下降法中通常用一个凸函数进行数形结合，好处是理解起来更加生动形象；（z=f(x,y)凸函数可以用山凹进行示意，盆地也挺形象，实在不行就理解为家里炒菜的锅的样子的函数图像）

2、梯度下降是迭代算法

3、梯度下降法的目的？

求出局部最优解；

对应数学基础：与多远函数的极值问题相对应，可参考中科大《数学分析教程》9.11极值 P419；局部最优解即求解驻点问题；

3.1）如果z=f(x,y)本身是凸函数，局部最优解就是全局最优；

3.2）如果z=f(x,y)不是凸函数，在求解局部最优时并不能说明就是全局最优解；这个函数可能有多个极小值,假设Value[i](i=1,2,3...)记为极值点，但最值点却只有一个，记为MinValue；MinValue = min{Value[1],Value[2]...Value[n]}

4、为什么梯度下降法求出解不一定是最小值？

4.1)随机初始值可能影响；

4.2)迭代算法本身的计算方式，使得求解陷于局部最优；

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。