【数值最优化】1. 线搜索方法

最新推荐文章于 2023-05-01 22:06:32 发布

Tina_FFang

最新推荐文章于 2023-05-01 22:06:32 发布

阅读量493

点赞数

分类专栏：数值优化学习笔记

本文链接：https://blog.csdn.net/Tina_FFang/article/details/109366692

版权

系列文章

【数值最优化】1. 线搜索方法
【数值最优化】2. 拟牛顿

本文目录

系列文章
一、步长选取
二、收敛速度
三、修正Hessian矩阵的Newton's method

线搜索是一种寻找函数 $f (x)$ 最值(此处默认为最小值)的迭代方法. 总体上, 线搜索方法迭代公式为
$x_{k+1}=x_{k}+\alpha_k p_k,$
其中 $\alpha_k$ 是步长(step length), $p_k$ 是下降方向(descent direction), $p_k^{\mathsf{T}}\nabla f_{k}<0$ , $p_k=-B_{k}^{-1}\nabla f_{k}$ .

一、步长选取

(1) Wolfe conditions

下降方向已经确定, 选取合适的步长. 令 $\phi(\alpha)=f(x_{k}+\alpha p_k)$ . 只要求 $\phi(\alpha)<\phi(0)$ 是不够的, 它可能还没到最小值, 但函数值已经收敛了. 所以提出了Armijo condition $f(x_{k}+\alpha p_k)\le c_1\alpha \nabla f_k^{\mathsf{T}}p_k,$ 其中 $0<c_1<1$ , 一般取 $10^{-4}$ . 这个条件要求函数值下降的足够多(在一条下降的直线的下方), 且总是能找到一个 $\alpha$ 能满足这个条件, 因为 $c_1\in (0,1)$ .

只有Armijo condition可能会使得 $\alpha$ 太小了, 收敛太慢, 为了让步长稍微大一点, 提出了curvature condition $\nabla f(x_{k}+\alpha_k p_k)^{\mathsf{T}}p_{k}\ge c_2 \nabla f_{k}^{\mathsf{T}} p_k,$ 其中 $c_2\in(c_1,1)$ . 采用Newton method或者quasi-Newton method时, $c_2$ 常取 $0.9$ , nonlinear conjugate gradient method, $0.1$ .

两个条件合在一起成为Wolfe conditions: $\begin{aligned} f(x_k+\alpha_k p_k)\le & f(x_{k})+c_1\alpha_k\nabla f_k^{\mathsf{T}} p_k,\\ \nabla f(x_{k}+\alpha_k p_k)^{\mathsf{T}}p_k\ge & c_2\nabla f_{k}^{\mathsf{T}}p_k, \end{aligned}$ $0<c_1<c_2<1$ .
Strong Wolfe conditions:
$\begin{aligned} f(x_k+\alpha_k p_k)\le & f(x_{k})+c_1\alpha_k\nabla f_k^{\mathsf{T}} p_k,\\ \left|\nabla f(x_{k}+\alpha_k p_k)^{\mathsf{T}}p_k\right|\ge & c_2\left|\nabla f_{k}^{\mathsf{T}}p_k\right|, \end{aligned}$

最低0.47元/天解锁文章

Tina_FFang

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
【数值最优化】1. 线搜索方法

系列文章【数值最优化】1. 线搜索方法【数值最优化】2. 拟牛顿(计划中)本文目录系列文章一、步长选取(1) Wolfe conditions(2) The Goldstein conditions(3) 向后线搜索二、收敛速度(1) 最速下降法(steepest-descent method)(2) Newton's method(3) Quasi-Newton methods三、修正Hessian矩阵的Newton's method线搜索是一种寻找函数f(x)f(x)f(x)最值(此处默认为
复制链接

扫一扫