最优化第三讲——无约束的梯度技术

本文详细介绍了无约束优化中的梯度下降法,包括算法框架、为什么选择负梯度方向作为寻优方向、步长选择的重要性、以及梯度下降的收敛性和一阶收敛性质。内容涵盖泰勒公式、最速下降方向证明、步长优化的局部与全局视角,以及连续两点梯度正交的证明。
摘要由CSDN通过智能技术生成

本讲主要看一下,在无约束的求解过程中使用的梯度技术

解决无约束问题的算法框架

1. 选定一个初始点x0,计算一些数值,例如x0的值f(x0),x0点的梯度,x0点的嗨森矩阵

2. 基于以上计算的信息,选定一个搜索方向d0

3. 沿着搜索方向找到下一个点x1,

4. 以以上的方法产生x1,x2,x3.....。

以上的方法称为逐次下降法,很多算法都是逐次下降法,只不过是确定搜索方向、确定步长的方法不同,本章主要介绍的事逐次下降法的一种-梯度下降法。

梯度,如果是一维的,那么其实就是导数,多维的,那么就是多每个变量求偏导

梯度下降法:就是以负梯度方向作为找极小值点的方向

这里就有两个问题

1. 为什么要以负梯度方向作为寻找极小值点的方向

证明如下图

第一行:根据泰勒公式得到

第二行:做了下等式变换

第三行:因为想找到最速下降的方向,也就是从当前点到下一个点的距离最大

第四行:最大化等式左边等于最小化等式右边的负值

第六行:向量相乘转化为夹角余弦跟模的乘积

最后得出dx的方向是梯度的反方向

2. 最有步长法(既然梯度的负方向是下降最快的方向,为什么实际使用的过程中用梯度下降方收敛的比较慢)

因为从局部看,也就是从当前点看,沿着负梯度的方向

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值