数值优化-信赖域方法

最新推荐文章于 2024-01-09 15:15:53 发布

Serendipity-Wu

最新推荐文章于 2024-01-09 15:15:53 发布

阅读量1.2k

点赞数

分类专栏：优化文章标签：机器学习算法人工智能

本文链接：https://blog.csdn.net/weixin_44077955/article/details/125945846

版权

优化专栏收录该内容

11 篇文章 6 订阅

订阅专栏

信赖域方法

除了之前讲过的线搜索方法，信赖域方法（trust region）也是数值优化中的一类重要的方法。在信赖域方法中我们需要定义一个信赖域，在这个信赖域中使用替代函数来代替原来的目标函数，通过优化替代函数来优化目标函数。本文和书中一致，采用二次函数来作为替代函数（model function $m_k$ )。 $m_k$ 是原函数 $f$ 在 $x_k$ 这点处的泰勒级数展开。

$f(x_k+p)=f_k+g^T_kp+\frac{1}{2}p^T \nabla^2f(x_k+tp)p$ $m_k(p)=f_k+g^T_kp+\frac{1}{2}p^TB_kp$

信赖域大小调节

既然有了信赖域，我们就需要定义信赖域的大小。我们需要使用一个评判标准来告知信赖域的设定是否合理，我们使用 $\rho_k$ 来判断。

$\rho_k=\frac{f(x_k)-f(x_k+p_k)}{m_k(0)-m_k(p_k)}$

分子为实际减小量，分母为预测减小量。当两者越接近1说明替代函数的效果越好。当信赖域大小导致不好的时候，需要减小信赖域，信赖域效果很好的时候需要增加信赖域范围。

在这里插入图片描述

优化替代函数问题

在信赖域方法中，我们需要对子问题进行求解。

在这里插入图片描述

求解这类问题可以求解精确解或者求解近似解。

在这里插入图片描述

精确解

当上述的条件符合时，4.8b只有两种可能， $\lambda=0$ 或者 $\nabla-\left\| p^*\right\|=0$ 。假设子问题的解在信赖域内，那么只可能是 $\lambda=0$ 。此时我们有 $Bp^*=-g$ （B是半正定的）。当另一种情况时 $\nabla-\left\| p^*\right\|=0$ ,可以得到 $\lambda p^*=-Bp^*-g=-\nabla m(p^*)$ ，此时解的方向和m的负梯度方向是相同的。

近似解

cauchy point：cauthy point 这个点就是mk在最速下降方向上的最小值，同时受到信赖域的约束。

第一个方法是dogleg方法，使用dogleg方法的前提是B必须是正定的。第二个方法是two-dimensional subspace minimization，当B不是正定时也可以使用。

在这里插入图片描述

在这里和前面不同的是我们并没有使用泰勒展开中的二次项，而是只展开到了一次项。所以说这是一个近似的解。引进 $\tau_k$ 的目的是为了保证信赖域的约束，并且使得 $m_k(\tau p^s_k)$ 在置信域内有最小值。（4.9）问题的解是 $p^c_k=-\tau_k \frac{\Delta_k}{\left\| g_k \right\|}g_k$ 。我们需要讨论 $g^T_k B_k g_k \leq0$ 和 $g^T_k B_k g_k >0$ 的情况。

$\tau_{k}= \begin{cases}1 & \text { if } g_{k}^{T} B_{k} g_{k} \leq 0 \\ \min \left(\left\|g_{k}\right\|^{3} /\left(\Delta_{k} g_{k}^{T} B_{k} g_{k}\right), 1\right) & \text { otherwise }\end{cases}$

初看这个式子可能不太清楚其由来，其实是二次函数求极值的问题的解。当第一种情况时，函数随着 $\tau$ 单调递减，为了在信赖域以内，我们能取的最大的 $\tau$ 为1。另一种情况时，需要代入 $\tau p^s_k$ 到函数中去，求导数令其等于零。，可以解出 $\tau=\frac{\left\| g_k \right\|^3}{\Delta_kg_k^TBg_k}$ ,当这个值大于了信赖域边界时不能直接取这个值，此时导数恒小于零，函数单调递减，所以 $\tau$ 取值为1。

dogleg method

在这里插入图片描述

当B是正定的时候，我们可以比较简单的知道，无约束最小化函数值的m为 $p^B=-B^{-1}g$ 。当这个点是可达的时候，这是问题的解

$p^*(\Delta)=p^B,\quad when \,\Delta \geq \left\| p^B \right\|$

当 $\Delta$ 的值比 $p^B$ 小很多的时候，我们忽略二次项，得到一个近似的解

$p^*(\Delta)\approx-\Delta\frac{g}{\left\| g \right\|}, \quad when\,\Delta \,is\,small$

当 $\Delta$ 的值属于中等大小的时候，dgoleg方法使用两个路径合起来来寻找近似最优解。

第一条线是从起始点到最速下降方向的最小点。

$p^U=-\frac{g^Tg}{g^TBg}g$

第二条是从 $p^U$ 到 $p^B$ ，我们把总的轨迹用下列公式表示

$\begin{equation} \tilde{p}(\tau)= \begin{cases} \tau p^U \quad 0\leq\tau\leq1\\ p^U+(\tau-1)(p^B-p^U)\quad 1\leq\tau\leq2 \end{cases} \nonumber \end{equation}$

书中这里讲的不是很详细，我看了一篇博客讲的不错，链接放到文末了。

参考资料

①：Numerical Optimization

②：暴力拆解《Numerical Optimization》之信任域方法（下）——Dogleg（狗腿方法）_xiaopihaierletian的博客-CSDN博客

Serendipity-Wu

关注

0
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
数值优化-信赖域方法

除了之前讲过的线搜索方法，信赖域方法（trustregion）也是数值优化中的一类重要的方法。在信赖域方法中我们需要定义一个信赖域，在这个信赖域中使用替代函数来代替原来的目标函数，通过优化替代函数来优化目标函数。本文和书中一致，采用二次函数来作为替代函数（modelfunctionmk)。mk是原函数f在xk这点处的泰勒级数展开。f(xk+p)=fk+gkTp+21pT∇2f(xk+tp)pmk。...
复制链接

扫一扫