无约束问题的梯度方法

刚看完这份PPT,记录一下自己的理解

应用梯度方法求目标函数的最小值点。

迭代下降算法分为搜索方向,确定步长。下降方向通过方向导数小于0判断,梯度方法就是下降方向取-\bigtriangledown f(x)的迭代算法。

求GD的收敛率

1.目标函数为二次函数

        确定步长的方法

       (1)不变步长方法

                通过观察(?)得到步长\eta =\left ( \lambda _{1}\left ( Q \right )+\lambda _{n}\left ( Q \right ) \right )   是最优选择,将步长带入证明,得到收敛率(\frac{\lambda _{1}\left ( Q \right )-\lambda _{n}\left ( Q \right )}{\lambda _{1}\left ( Q \right )+\lambda _{n}\left ( Q \right )})^{t}

       (2) 精确线搜索     

                步长的确定方法为令f(x^{k}-\eta \bigtriangledown f(x^{k}))为关于\eta的函数,求\eta _{t}=min_{\eta }g(\eta )=min_{\eta }f(x^{k}-\eta\bigtriangledown f(x^{k}) ),带入函数式可化为关于\eta的二次函数,可求出f(x)取到最小值时\eta的取值,继而求出收敛率为(\frac{\lambda _{1}\left ( Q \right )-\lambda _{n}\left ( Q \right )}{\lambda _{1}\left ( Q \right )+\lambda _{n}\left ( Q \right )})^{2t},可以看出比不变步长快。

2.目标函数为具有强凸性和光滑性的二次函数

        (1) 用固定步长的方法

                对比上面的不变步长

        (2) 回溯线性搜索

                收敛率为(1-min\left \{ 2\alpha \mu ,\frac{2\beta \alpha \mu }{L} \right \})^{t}(?)

3. 目标函数为具有凸性和光滑性的二次函数

        没有强凸性,能更好地集中在目标值的改进(即f(x)的改进)而不是估计误差的改进(应该是\left \| x^{t}-x^{*} \right \|)    ??

4. 非凸问题

        目标:找到近似驻点

        ?

        梯度趋于0,可能是全局或局部最小值,也有可能是鞍点,如果初始点在鞍点GD就会被困住,可用随机初始化的方法避免鞍区。有一个论断,经过多次迭代会逃离鞍点。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值