迭代求解最优化问题——步长确定

最新推荐文章于 2024-05-12 10:58:01 发布

炽霜

最新推荐文章于 2024-05-12 10:58:01 发布

阅读量2.6w

点赞数 6

分类专栏：数值优化文章标签：优化迭代

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/frozenspring/article/details/78888792

版权

数值优化专栏收录该内容

8 篇文章 3 订阅

订阅专栏

梯度下降法和牛顿法其实在某种程度上只是确定了下降的方向。而下降的步长（收敛速率系数）还需要我们自己确定。而对于不同的问题下降的步长往往也是不一样的。这就造成了一些麻烦。

线搜索

前面提到迭代求解最优化问题 $\min f(x)$ 的一般形式是 $x_{k+1}=x_k+\Delta$ 。事实上我们可以把 $\Delta$ 分为两个部分：方向和步长。

先确定方向，再确定步长的算法称为线搜索算法。它的一般形式为。

x k + 1 = x k + α k p k

$x_{k+1}=x_k+\alpha_k p_k$
其中

α α $\alpha$ 为步长，

p p $p$ 为方向。显然有

\nabla f_{k} p_{k} \leq 0

$\nabla f_k p_k \le 0$ 。进而有

pk=−B−1k∇fk p k = − B k − 1 ∇ f k $p_k=-B_k^{-1}\nabla f_k$ 。其中B为对称非奇异矩阵。

当B为I时，即为梯度下降法
当B为 $\nabla^2f_k$ 时，即为牛顿法
当B通过迭代进行更新时，为拟牛顿法
当B为 $J^TJ$ 时，为高斯-牛顿法

当搜索方向确定后，就需要确定步长。

步长

而如何得到一个合适的步长这个问题又构成了一个最优化问题，即

min h (α) = f (x k + α p k)

$\min h(\alpha)=f(x_k+\alpha p_k)$
对这个优化问题我们可以根据具体情况求出闭式解，但是这往往会很复杂。因此我们仅仅对它进行一个粗略的估计，从而在可接受的计算量的情况下，尽可能的求得较大的步长，使得h(α)尽可能降低。

（天啊，为了求解最优化问题的一步迭代步长我们又构造了一个最优化问题来进行迭代）

Armijo条件

为了满足上面的条件，人们提出了很多准则来判断步长是否合适。比如Armijo条件，这个准则的数学定义如下：

f (x k + α p k) \leq f (x k) + α c \nabla f k p k

$f(x_k+\alpha p_k)≤f(x_k)+\alpha c \nabla f_k p_k$
其中

c∈(0,1) c ∈ ( 0 , 1 ) $c \in (0,1)$ 。

可以看到，这个条件约束了 $h(\alpha)$ 的变化情况，使得损失函数能够尽量降低。

回溯线搜索（Backtracking line search）

在这里介绍的回溯线搜索算法即是在这些原则的基础上实现的。回溯线算法的基本思想是在搜索方向上先设置一个较大的初始步长，如果步长太大，则以一定比例缩减步长直到满足Armijo条件。这种搜索算法就满足了步长选择的另外一个准则——每次迭代的步长尽可能大。

具体来说该算法的流程如下：

使用一个较大的步长 $\alpha_0$ 对步长进行初始化。确定缩减因子 $τ \in (0,1)$ 和 $c \in (0,1)$
当Armijo条件不满足时，令 $\alpha_j=τ\alpha_{j-1}$
返回 $\alpha_j$

关注

6
点赞
踩
47

收藏

觉得还不错? 一键收藏
6
评论
迭代求解最优化问题——步长确定

线搜索前面提到迭代求解最优化问题的一般形式是xk+1=xk+Δx_{k+1}=x_k+\Delta。事实上我们可以把Δ\Delta分为两个部分：方向和步长。先确定方向，再确定步长的算法称为信赖域算法。它的一般形式为。梯度下降法和牛顿法其实在某种程度上只是确定了下降的方向。而下降的步长还需要我们自己确定。而对于不同的问题下降的步长往往也是不一样的。
复制链接

扫一扫

专栏目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。