漫步最优化四十二——Partan法

最新推荐文章于 2021-05-20 14:20:11 发布

会敲键盘的猩猩

最新推荐文章于 2021-05-20 14:20:11 发布

阅读量884

点赞数

分类专栏：漫步最优化文章标签： Partan zigzag

漫步最优化专栏收录该内容

44 篇文章 50 订阅

订阅专栏

漆黑的冷空中有你， $\textbf{漆黑的冷空中有你，}$

惺忪的眼睛中有你， $\textbf{惺忪的眼睛中有你，}$

心底的记忆中有你， $\textbf{心底的记忆中有你，}$

你留在我的脑海中， $\textbf{你留在我的脑海中，}$

一直这么挥之不去。 $\textbf{一直这么挥之不去。}$

无论哪时哪刻， $\textbf{无论哪时哪刻，}$

心中都想着你的笑， $\textbf{心中都想着你的笑，}$

想着你到我侧相拥， $\textbf{想着你到我侧相拥，}$

I can dream about you. $\textbf{I can dream about you.}$

——畅宝宝的傻逼哥哥 $\textbf{——畅宝宝的傻逼哥哥}$

在早期的最优化中，对于两变量函数来说，用最速下降法得出的解轨迹表征出zig-zag模式。对于某些性质较好的函数，相邻的解差不多组成两条线，他们在最小值的邻域内相交，如图1所示，因此比较明显的策略是连接初始点与第二个解，沿着这个方向执行最速下降法。对于凸二次函数，在

n $n$ 次迭代内就能收敛，这个方法也被称为parallel tangent法或着partan法，这是因为在二次函数的情况下，所得轮廓的正切属性。

这里写图片描述

图1

Partan算法如图2所示，假设初始点为

x0 $\mathbf{x}_0$ ，并利用两次最速下降法得到点

x1,y1 $\mathbf{x}_1,\mathbf{y}_1$ ，然后沿着

y1−x1 $\mathbf{y}_1-\mathbf{x}_1$ 方向进行线搜索得到点

x2 $\mathbf{x}_2$ ，这就完成了第一次迭代。对于第二次迭代，对点

x2 $\mathbf{x}_2$ 执行最速下降得到点

y2 $\mathbf{y}_2$ ，沿着

y2−x1 $\mathbf{y}_2-\mathbf{x}_1$ 方向得到点

x3 $\mathbf{x}_3$ ，一直重复此过程。从效果上看，图2中的点

y1,y2,… $\mathbf{y}_1,\mathbf{y}_2,\ldots$ 是通过最速下降法得到的而

x2,x3,… $\mathbf{x}_2,\mathbf{x}_3,\ldots$ 是沿着方向

y2−x1,y3−x2,… $\mathbf{y}_2-\mathbf{x}_1,\mathbf{y}_3-\mathbf{x}_2,\ldots$ 方向用线搜索得到的。

这里写图片描述

图2

对于凸二次问题，连接

x1,x2,…,xk $\mathbf{x}_1,\mathbf{x}_2,\ldots,\mathbf{x}_k$ 的线组成一个共轭梯度方向集，可以通过以下方法来证明：先假设

d0,d1,…,dk−1 $\mathbf{d}_0,\mathbf{d}_1,\ldots,\mathbf{d}_{k-1}$ 是共轭梯度方向集，然后说明

dk $\mathbf{d}_k$ 是

d0,d1,…,dk−1 $\mathbf{d}_0,\mathbf{d}_1,\ldots,\mathbf{d}_{k-1}$ 的共轭梯度方向。

考虑图3所示的步骤，注意到

g T k d i = 0 for 0 \leq i < k (1)

$\begin{equation} \mathbf{g}_k^T\mathbf{d}_i=0\quad\text{for}\ 0\leq i<k\tag1 \end{equation}$

根据之前共轭梯度的结论可知点 $\mathbf{x}_{k-1}$ 处的梯度可以写成

g k - 1 = \sum i = 0 k - 1 a i d i

$\mathbf{g}_{k-1}=\sum_{i=0}^{k-1}a_i\mathbf{d}_i$

其中 $a_i,i=0,1,\ldots,k-1$ 为常数，所以

g T k g k - 1 = g T k (b + H x k - 1) = \sum i = 0 k - 1 a i g T k d i = 0 (2)

$\begin{equation} \mathbf{g}_{k}^T\mathbf{g}_{k-1}=\mathbf{g}_k^T(\mathbf{b}+\mathbf{Hx}_{k-1})=\sum_{i=0}^{k-1}a_i\mathbf{g}_k^T\mathbf{d}_i=0\tag2 \end{equation}$

或者

g T k b = - g T k H x k - 1 (3)

$\begin{equation} \mathbf{g}_k^T\mathbf{b}=-\mathbf{g}_k^T\mathbf{Hx}_{k-1}\tag3 \end{equation}$

因为 $\mathbf{y}_k$ 是点 $\mathbf{x}_k$ 用最速下降法得到的，所以我们有

y k - x k = - g k

$\mathbf{y}_k-\mathbf{x}_k=-\mathbf{g}_k$

另外

- g (y k) T g k = g T k (b + H y k) = 0

$-\mathbf{g}(\mathbf{y}_k)^T\mathbf{g}_k=\mathbf{g}_k^T(\mathbf{b}+\mathbf{Hy}_k)=0$

或者

g T k b = - g T k H y k (4)

$\begin{equation} \mathbf{g}_k^T\mathbf{b}=-\mathbf{g}_k^T\mathbf{Hy}_k\tag4 \end{equation}$

因此，根据等式3与4可得

g T k H (y k - x k - 1) = 0 (5)

$\begin{equation} \mathbf{g}_k^T\mathbf{H}(\mathbf{y}_k-\mathbf{x}_{k-1})=0\tag5 \end{equation}$

图3

因为

y k - x k - 1 = β (x k - 1 - x k - 1)

$\mathbf{y}_k-\mathbf{x}_{k-1}=\beta(\mathbf{x}_{k-1}-\mathbf{x}_{k-1})$

其中 $\beta$ 是常数，等式5可以写成

g T k H (x k + 1 - x k - 1) = 0

$\mathbf{g}_k^T\mathbf{H}(\mathbf{x}_{k+1}-\mathbf{x}_{k-1})=0$

或者

g T k H x k + 1 = g T k H x k - 1 (6)

$\begin{equation} \mathbf{g}_k^T\mathbf{H}\mathbf{x}_{k+1}=\mathbf{g}_k^T\mathbf{H}\mathbf{x}_{k-1}\tag6 \end{equation}$

接下来我们能够写成

g T k H x k + 1 = g T k H x k - 1 (7)

$\begin{equation} \mathbf{g}_k^T\mathbf{Hx}_{k+1}=\mathbf{g}_k^T\mathbf{Hx}_{k-1}\tag7 \end{equation}$

那么根据

g T k g k + 1 = g T k (b + H x k + 1) (8)

$\begin{equation} \mathbf{g}_k^T\mathbf{g}_{k+1}=\mathbf{g}_k^T(\mathbf{b}+\mathbf{Hx}_{k+1})\tag8 \end{equation}$

以及等式2，等式6与等式9可得

g T k g k + 1 = g T k (b + H x k - 1) = g T k g k - 1 = 0 (9)

$\begin{align} \mathbf{g}_{k}^T\mathbf{g}_{k+1} &=\mathbf{g}_k^T(\mathbf{b}+\mathbf{Hx}_{k-1})\notag\\ &=\mathbf{g}_k^T\mathbf{g}_{k-1}=0\tag9 \end{align}$

点 $\mathbf{x}_{k+1}$ 是在 $\mathbf{x}_{k+1}-\mathbf{y}_k$ 方向上使用线搜索得到的，因此