机器学习笔记之优化算法(二)线搜索方法(方向角度)

静静的喝酒

已于 2023-07-28 16:18:02 修改

阅读量1k

点赞数 2

分类专栏：机器学习深度学习文章标签：机器学习优化算法线搜索方法更新方向与负梯度方向之间关系泰勒公式

于 2023-07-28 15:25:32 首次发布

本文链接：https://blog.csdn.net/qq_34758157/article/details/131974077

版权

机器学习笔记之优化算法——线搜索方法[方向角度]

引言

引言

上一节对优化问题进行了简单描述，并从逻辑认知的角度介绍了线搜索方法与信赖域方法。本节将关注线搜索方法，并重点关注它的方向部分。

回顾：线搜索方法

线搜索方法是一种通过求解数值解来计算最优解的方法。其特点是：在数值解的迭代求解过程中，分为方向与步长分别执行，并且先定方向，后定步长。对应的数学符号表达如下：
$x_{k+1} = x_k + \alpha_k \cdot \mathcal P_k$
其中 $\alpha_k$ 表示步长， $\mathcal P_k$ 表示方向。并且步长的重要程度高于方向。

从方向角度观察线搜索方法

我们首先对优化问题(场景)进行一系列的假设以达到简化作用。

场景构建

假设1：目标函数结果的单调性

关于变量 $\mathcal X$ 的目标函数 $f(\mathcal X)$ ，我们最终目标是选择一个合适的 $\mathcal X = x$ ，使得目标函数达到最值。这里以最小值为例，对应数学符号表示如下：
$\mathop{\min}\limits_{\mathcal X \in \mathbb R^n} f(\mathcal X)$

迭代之前，我们给定关于 $\mathcal X$ 的初始化信息： $x_0$ ，并在迭代过程中通过策略得到一系列数值解： $\{x_k\}_{k=1}^{\infty}$ ，它们对应的目标函数结果表示如下：
$\{f(x_k)\}_{k=0}^{\infty}$

上一节介绍过，目标函数结果所描述的数列存在单调性，但这个单调性可能是不严格的：

如果数列满足严格的单调性，有：
$f(x_{k+1}) < f(x_k) \quad f(x_k),f(x_{k+1}) \in \{f(x_k)\}_{k=0}^{\infty}$
相反，如果数列的单调性不严格，有：
$f(x_{k+1}) < f(x_{k-m}) \quad f(x_{k+1}),f(x_{k-m}) \in \{f(x_k)\}_{k=0}^{\infty};m \in [0,k]$

也就是说，严格的单调性需要数列中的元素按照顺序严格递减；而不严格的单调性仅需要趋势递减即可，局部元素之间的大小关系并不是关注的重点。
在真实情况下，单调性的严格/不严格并不是绝对的。在迭代之前，初始化信息 $x_0$ 一般是随机初始化，从而导致 $x_0$ 到最优解 $x^*$ 的距离是随机的。因此在迭代初期，我们通常会采用不严格的递减方式，随着数值解 $x_k$ 逐步逼近最优解 $x^*$ ,我们会调整参数 $m$ ,使其逐步地向严格的递减方式转化。