数值计算之共轭梯度法（1）线性共轭梯度法

最新推荐文章于 2022-09-06 15:29:33 发布

RuiH.AI

最新推荐文章于 2022-09-06 15:29:33 发布

阅读量2.4k

点赞数 2

分类专栏：概率论与机器学习文章标签：线性代数机器学习人工智能

本文链接：https://blog.csdn.net/qq_41035283/article/details/122045201

版权

概率论与机器学习专栏收录该内容

50 篇文章 85 订阅

订阅专栏

数值计算之共轭梯度法（1）线性共轭梯度法

前言
共轭梯度法的引出
线性共轭梯度法
- 共轭向量组构造
- 线性共轭梯度流程
补充：线性共轭梯度法的简化

前言

本篇继续无约束优化算法学习，线性共轭梯度法。

共轭梯度法的引出

回顾之前的牛顿法、拟牛顿法，目的都是寻找迭代方向。牛顿法中的 $H\Delta x=J$ ，高斯牛顿的 $JJ^Tp=-Jf$ ，都涉及到一个解方程组的问题。如果方程组是线性的，则解线性方程组 $A x = b$ 的问题可以转化为一个优化问题：
$\\ \to \argmin_{x} f(x) = \frac{1}{2}x^TAx-b^Tx \\ \quad \\ because \quad \nabla f(x)=Ax-b=0 \\ when \quad f(x)=\min f(x)$

在梯度下降法中，迭代过程可能出现下图的折线。这是因为梯度下降法只考虑了一阶梯度，当前迭代的方向可能与上次迭代的方向线性相关，使得迭代过程来回抖动。
在这里插入图片描述
即使通过线搜索方法得到最优步长时，相邻两次迭代的梯度正交，如下图所示，将增量进行分解，不朝向极值点的分量仍然会导致抖动。

这里证明一下精确线搜索的梯度下降法，两次梯度正交：
$最优步长处，f关于\alpha的导数为0 \\ f' (x_{k+1})=f'(x_k+\alpha (-\nabla f(x_k)))=0 \\ \to f'(x_k+\alpha (-\nabla f(x_k))= -\nabla f(x_k)^T\nabla f(x_{k+1}) =0$
在这里插入图片描述
共轭梯度法要解决的就是生成下面这条绿线的迭代过程。

线性共轭梯度法

对于对称正定矩阵 $A$ ，如果存在一个向量组 $\{ \delta _n\},\delta_i^TA\delta_j=0$ 对于任意两个不同的向量都成立，称向量组是 $A$ 的共轭向量组。共轭向量组是线性无关的，可以用反证法证明：
$\quad d_1=\lambda_2d_2+\dots+\lambda_nd_n \\ then \quad d_i^TAd_j=(\lambda_2d_2+\dots+\lambda_nd_n)^TAd_j \\ = \lambda d_j^TAd_j=0 \\ then \quad \forall j, \quad d_j=\vec 0$

共轭梯度法证明了对于二次型的优化问题，可以通过构造共轭向量组 $\{ \delta _n\}$ ，依次沿着每个共轭向量（梯度）上优化后，就能得到极小值。也就是说，迭代 $n$ 次后就能得到结果。

共轭向量组构造

第一个共轭向量可以通过梯度下降法获得 $p_0$ ，梯度下降法得到的相邻梯度是正交的（线性无关），因此可以用来构造共轭向量：
$\alpha_0通过精确线搜索获得 \\ p_0 = -\nabla f(x_0) \\ \hat p_1=-\nabla f(x_0+\alpha_0 p_0) \\ p_1 =\hat p_1 + \beta_1p_0=\nabla f(x_0+\alpha_0 p_0)-\beta_1p_0 \\ \quad \\ p_0^TAp_1=0 \\ \beta_1p_0^TAp_0 - p_0^TA\nabla f(x_0+\alpha_0 p_0)=0 \\ \quad \\ \beta_1 = \frac{p_0^TA\nabla f(x_0+\alpha_0 p_0)}{p_0^TAp_0} \\ \quad \\$
然后迭代构造每一步的共轭向量：
$\alpha_k通过精确线搜索获得 \\ p_{k+1} = \beta_{k+1} p_{k}+\hat p_{k+1} \\ \beta_{k+1}=\frac{p_k^T A \nabla f(x_k+\alpha_kp_k)}{p_k^TAp_k}$
可以证明，上面的迭代出的共轭向量可以构成共轭向量组。

然后通过精确线搜索获得 $\alpha_{k+1}$ ：
$\alpha_{k+1}=\frac{p_{k+1}^T\hat p_{k+1}}{p_{k+1}^TAp_{k+1}}$

线性共轭梯度流程

给定 $x_0$ ，通过梯度下降法获得初始 $p_0,\alpha_0$
迭代到第k次，判断收敛条件，若不满足，进入3；否则跳出循环
通过共轭梯度构造公式依次计算 $x_{k+1},\beta_{k+1},p_{k+1},\alpha_{k+1}$ ，判断收敛条件，若不满足则回到2

补充：线性共轭梯度法的简化

前面推导的时候，没有用到线性条件 $\nabla f(x)=Ax-b$ ，这里可以进行简化。首先给出简化后的精确线搜索步长：
$f'(x_k+\alpha_k p_k)=p_k^T\nabla f(x_k+\alpha_k p_k)=0 \\ \to p_k^T(A(x_k+\alpha_k p_k)-b)=0 \\ \to p_k^TAx_k+\alpha_k p_k^TAp_k=p_k^Tb \\ \quad \\ \to \alpha_k=\frac {p_k^T(b-Ax_k)}{p^T_kAp_k} \\ set \quad b-Ax_k=r_k, \quad \alpha_k = \frac {r^T_kp_k}{p^T_kAp_k}$
然后构造共轭梯度向量：
$p_{k+1}=\nabla f(x_{k}+\alpha_kp_k)+\beta_{k+1} p_k \\ and \quad p_{k}^TAp_{k+1}=0 \\ \to p_k^TA\nabla f(x_{k}+\alpha_kp_k)+\beta_{k+1} p_k^TAp_k=0 \\ \to \beta_{k+1} p_k^TAp_k= -p_k^TA\nabla f(x_{k}+\alpha_kp_k) \\ \quad \\ \beta_{k+1} = -\frac{p_k^TA\nabla f(x_{k}+\alpha_kp_k)}{p_k^TAp_k} \\ \quad \\ = -\frac {p_k^TA(Ax_{k+1}-b)}{p_k^TAp_k} \\ = \frac {r_{k+1}^TAp_{k}}{p_k^TAp_k} \\$

最后梳理一下：

初始化 $k = 0$ ，计算 $x_0,p_0$
迭代第 $k + 1$ 轮，判断收敛条件，不满足时继续循环
$\alpha_k=\frac {r^T_kp_k}{p^T_kAp_k}$
$x_{k+1}=x_k+\alpha_k p_k$
$r_{k+1}=b-Ax_{k+1}$
$\beta_{k+1}=\frac {r_{k+1}^TAp_{k}}{p_k^TAp_k}$
$p_{k+1}=-r_{k+1}+\beta_{k+1}p_k$
$k = k + 1$

RuiH.AI

关注

2
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
数值计算之共轭梯度法（1）线性共轭梯度法

数值计算之共轭梯度法（1）线性共轭梯度法前言共轭梯度法的引出线性共轭梯度法共轭向量组构造线性共轭梯度流程补充：线性共轭梯度法的简化前言本篇继续无约束优化算法学习，线性共轭梯度法。共轭梯度法的引出回顾之前的牛顿法、拟牛顿法，目的都是寻找迭代方向。牛顿法中的HΔx=JH\Delta x=JHΔx=J，高斯牛顿的JJTp=−JfJJ^Tp=-JfJJTp=−Jf，都涉及到一个解方程组的问题。如果方程组是线性的，则解线性方程组Ax=bAx=bAx=b的问题可以转化为一个优化问题：Ax=b→arg min
复制链接

扫一扫