概述
作为一种迭代的优化方法,共轭梯度(Conjugate Gradient,cg)由Hestenes和Stiefe于1951年提出。cg是针对形如式(1-1)的优化方法。
Ax=b(1-1)
需要指出的是,式(1-1)有着广泛的应用场景。例如,令 x∗ 为二次问题(如式(1-2)所示)的最小值:
f(x)=12xTAx−bx(1-2)
x∗=argminxf(x)(1-3)
则有
∇f(x∗)=Ax∗−b=0(1-4)
显然,式(1-4)可以用cg方法求解。
此外,牛顿法的每轮迭代需要计算 dk=−(H(k))−1gk ,即 H(k)dk=−gk 。此时,也可以使用cg来求取。
原理
共轭的定义
令 A∈Rn×n 是对称正定矩阵。对于 d(i),d(j)∈Rn ,若有 (d(i))TAd(j)=0 ,则称 d(i) 与 d(j) 关于 A 共轭。
对于一组向量
需要指出的是,共轭是正交的推广。这是因为,若
可以证明关于 A 共轭的一组向量
几何意义
对于二次函数
f(x)=12(x−x∗)TA(x−x∗)