最优化第三讲——无约束的梯度技术

最新推荐文章于 2024-01-01 19:45:49 发布

厚hou

最新推荐文章于 2024-01-01 19:45:49 发布

阅读量1.9k

点赞数 2

分类专栏：最优化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/nwpuwyk/article/details/26518111

版权

本文详细介绍了无约束优化中的梯度下降法，包括算法框架、为什么选择负梯度方向作为寻优方向、步长选择的重要性、以及梯度下降的收敛性和一阶收敛性质。内容涵盖泰勒公式、最速下降方向证明、步长优化的局部与全局视角，以及连续两点梯度正交的证明。

摘要由CSDN通过智能技术生成

本讲主要看一下，在无约束的求解过程中使用的梯度技术

解决无约束问题的算法框架

1. 选定一个初始点x0，计算一些数值，例如x0的值f(x0)，x0点的梯度，x0点的嗨森矩阵

2. 基于以上计算的信息，选定一个搜索方向d0

3. 沿着搜索方向找到下一个点x1,

4. 以以上的方法产生x1，x2，x3.....。

以上的方法称为逐次下降法，很多算法都是逐次下降法，只不过是确定搜索方向、确定步长的方法不同，本章主要介绍的事逐次下降法的一种-梯度下降法。

梯度，如果是一维的，那么其实就是导数，多维的，那么就是多每个变量求偏导

梯度下降法：就是以负梯度方向作为找极小值点的方向

这里就有两个问题

1. 为什么要以负梯度方向作为寻找极小值点的方向

证明如下图

第一行：根据泰勒公式得到

第二行：做了下等式变换

第三行：因为想找到最速下降的方向，也就是从当前点到下一个点的距离最大

第四行：最大化等式左边等于最小化等式右边的负值

第六行：向量相乘转化为夹角余弦跟模的乘积

最后得出dx的方向是梯度的反方向

2. 最有步长法（既然梯度的负方向是下降最快的方向，为什么实际使用的过程中用梯度下降方收敛的比较慢）

因为从局部看，也就是从当前点看，沿着负梯度的方向

最低0.47元/天解锁文章

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。