共轭梯度法(Conjugate gradient)详解

最新推荐文章于 2025-02-20 19:52:14 发布

bitcarmanlee

最新推荐文章于 2025-02-20 19:52:14 发布

阅读量3w

点赞数 73

分类专栏： convex optimization 文章标签：共轭梯度 conjugate gradient

本文链接：https://blog.csdn.net/bitcarmanlee/article/details/121522734

版权

convex optimization 专栏收录该内容

7 篇文章

订阅专栏

1.什么是共轭向量

对于正定矩阵Q，如果有
$x^TQy = 0$
那么我们可以称x, y是关于Q-conjugate。

2.线性方程组求解与二次函数求极小值转化

最初，共轭梯度法是用来求解线性方程 $A x = b$ 的一种方法，特别是稀疏线性方程组迭代求解法里面最优秀的方法，其被称为线性共轭梯度法。后来，人们把这种方法慢慢推广到了非线性问题求解中，称为非线性共轭梯度法。

求解 $A x = b$ 时，最简单粗暴的方式为 $x = A^{-1}b$ 。但是这种方法的问题很明显：求逆矩阵的计算复杂度非常高。即使我们考虑用矩阵分解的方式，仍然会很慢。因此，我们尽可能考虑用迭代的方式，而不是直接求逆的方式来解这个问题。

如果构造一个二次函数：
$\frac{1}{2}x^TAx - b^Tx$

对其求最小值，即令导数为零：
$\nabla f(x) = Ax - b^T = 0$

此时，正好是线性方程组 $A x - b = 0$ 的解。因此，我们可以将线性方程组求解问题转化为二次函数求极小值问题。

3.求解过程

根据第二部分推导，将求线性方程组解的问题转化为求二次函数极小值
$\frac{1}{2}x^TQx - b^Tx$

结合第一部分，我们找到n个相互Q-conjugate的向量 $d_1, d_2, d_3, \cdots, d_n$ ，他们相互共轭且线性无关，则空间任意向量x可以用该组基向量表示：
$\sum_{i=1} ^n a_i d_i$

上面的目标函数f(x)可以表示为如下
在这里插入图片描述
注意因为d是一组共轭向量，所以当 $\neq j$ 时，有 $d_i^TQd_j=0$

上面的公式可以变为
$\underset {a1,\cdots,a_n \in R^n}{min} \frac{1}{2} \sum_{i=1}^n a_i ^ 2 d_i ^TQd_i - \sum_{i=1}^na_ib^Td_i$
进一步化简，
$\underset {a1,\cdots,a_n \in R^n}{min} \frac{1}{2} \sum_{i=1}^n (a_i ^ 2 d_i ^TQd_i - a_ib^Td_i)$

现在变量 $a_1, a_2, \cdots, a_n$ 已经被分开了，将上面的式子再改写一下

$\underset {a1,\cdots,a_n \in R^n}{min} \frac{1}{2} (a_1 ^ 2 d_1 ^TQd_1 - a_1b^Td_1) + \frac{1}{2} (a_2 ^ 2 d_2 ^TQd_2 - a_2b^Td_2) + \cdots + \frac{1}{2} (a_n ^ 2 d_n ^TQd_n - a_nb^Td_n)$