最优化方法Python计算：正定二次型共轭梯度算法

戌崂石

已于 2024-05-11 19:31:25 修改

阅读量478

点赞数

分类专栏：最优化方法文章标签： python 最优化方法人工智能

于 2023-08-17 18:56:55 首次发布

本文链接：https://blog.csdn.net/u012958850/article/details/132346891

版权

最优化方法专栏收录该内容

32 篇文章 5 订阅

订阅专栏

用基本共轭方向法（详见博文《最优化方法Python计算：基本共轭方向算法》）计算正定二次型目标函数 $f(\boldsymbol{x})=\frac{1}{2}\boldsymbol{x}^\top\boldsymbol{Hx}-\boldsymbol{x}^\top\boldsymbol{b}$ ， $\boldsymbol{x}\in\text{ℝ}^n$ 的最优解点 $\boldsymbol{x}_0$ ，效率是很高的：至多迭代 $n$ 次，并且初始点的选取是任意的。然而，共轭方向法需要事先计算正定阵 $\boldsymbol{H}$ 的共轭向量组 $\boldsymbol{d}_1,\boldsymbol{d}_2,\cdots,\boldsymbol{d}_n$ 。本文探讨一个在搜索过程中动态生成共轭向量 $\boldsymbol{d}_1,\boldsymbol{d}_2,\cdots,\boldsymbol{d}_k$ ， $k=1,2,\cdots$ 的搜索方法。
定理1 二次型目标函数
$f(\boldsymbol{x})=\frac{1}{2}\boldsymbol{x}^\top\boldsymbol{Hx}-\boldsymbol{x}^\top\boldsymbol{b},\boldsymbol{x}\in\text{ℝ}^n$
其中， $\boldsymbol{H}\in\text{ℝ}^{n\times n}$ 为正定矩阵。任取 $\boldsymbol{x}_1\in\text{ℝ}^n$ ，记 $\nabla f(\boldsymbol{x}_1)=\boldsymbol{g}_1$ ，若 $\boldsymbol{g}_1\not=\boldsymbol{o}$ ，设 $\boldsymbol{d}_1=-\boldsymbol{g}_1,\alpha_1=-\frac{\boldsymbol{g}_1^\top\boldsymbol{d}_1}{\boldsymbol{d}_1^\top\boldsymbol{Hd}_1}$ 。对 $1\leq k\leq n$ ， $\boldsymbol{x}_{k+1}=\boldsymbol{x}_k+\alpha_k\boldsymbol{d}_k$ 。假定对每个 $k$ ， $\boldsymbol{g}_{k+1}=\nabla f(\boldsymbol{x}_k)\not=\boldsymbol{o}$ ， $\alpha_k=-\frac{\boldsymbol{g}_k^\top\boldsymbol{d}_k}{\boldsymbol{d}_k^\top\boldsymbol{Hd}_k}$ ， $\beta_k=\frac{\boldsymbol{g}_{k+1}^\top\boldsymbol{Hd}_{k}}{\boldsymbol{d}_k^\top\boldsymbol{Hd}_k}$ ， $\boldsymbol{d}_{k+1}=-\boldsymbol{g}_k+\beta_k\boldsymbol{d}_k$ ，则 $\boldsymbol{d}_1,\boldsymbol{d}_2,\cdots,\boldsymbol{d}_{k+1}$ 关于 $\boldsymbol{H}$ 共轭，且则存在 $1\leq m\leq n+1$ ，使得 $\boldsymbol{x}_{m}=\boldsymbol{x}_0$ 。其中 $\boldsymbol{x}_0$ 为 $f(\boldsymbol{x})$ 的最优解点。
利用定理1，我们将解正定二次型函数 $f(\boldsymbol{x})=\frac{1}{2}\boldsymbol{x}^\top\boldsymbol{Hx}-\boldsymbol{x}^\top\boldsymbol{b}$ 最优解的基本共轭算法加以修改，由于正定矩阵 $\boldsymbol{H}$ 每个共轭向量 $\boldsymbol{d}_{k+1}=-\boldsymbol{g}_k+\beta_k\boldsymbol{d}_k$ 均由梯度 $\boldsymbol{g}_{k}=\nabla f(\boldsymbol{x}_k)$ 算得，故称为共轭梯度算法。以下的Python函数实现共轭梯度算法。

import numpy as np                                                      #导入numpy
from scipy.optimize import OptimizeResult                               #导入OptimizeResult
def conjG(x1,H,b,c,gtol=1e-5):                                          #实现共轭梯度算法的函数
    xk=x1                                                               #设置初始迭代点
    gk=(np.matmul(H,xk)-b)                                              #计算当前梯度
    dk=-gk                                                              #搜索方向
    k=1
    while np.linalg.norm(gk)>=gtol:                                     #只要梯度不为0
        ak=-np.matmul(gk,dk)/np.matmul(np.matmul(dk,H),dk)              #搜索步长
        xk+=ak*dk                                                       #更新迭代点
        gk=(np.matmul(H,xk)-b)                                          #计算当前梯度
        bk=np.matmul(np.matmul(gk,H),dk)/np.matmul(np.matmul(dk,H),dk)  #计算beta
        dk=-gk+bk*dk                                                    #计算搜索方向
        k+=1
    bestx=xk
    besty=(np.matmul(np.matmul(xk,H),xk)/2-np.matmul(b,xk))+c
    return OptimizeResult(fun=besty, x=bestx, nit=k)

程序的第3~17行定义的conjG函数实现共轭梯度算法，参数x1表示初始迭代点 $\boldsymbol{x}_1$ ，H，b，c分别表示函数 $f(\boldsymbol{x})$ 表达式中的矩阵 $\boldsymbol{H}$ ，向量 $\boldsymbol{b}$ 和常数 $c$ ，gtol表示容错误差 $\varepsilon$ ，缺省值为 $10^{-5}$ 。
第4~7行进行初始化操作：第4行用x1初始化表示迭代点 $\boldsymbol{x}_k$ 的xk。第5行计算二次型函数 $f(\boldsymbol{x})$ 的梯度
$\boldsymbol{g}_1=\nabla f(\boldsymbol{x}_1)=\boldsymbol{Hx}_1-\boldsymbol{b}$
赋予gk。第6行按定理1计算搜索方向
$\boldsymbol{d}_1=-\nabla f(\boldsymbol{x}_1)=-\boldsymbol{g}_1$
赋予dk。第7行将迭代次数k初始化为1。\par
第8~14行的while循环执行迭代：第9行按定理1计算
$\alpha_k=\frac{-\boldsymbol{g}_k^\top\boldsymbol{d}_k}{\boldsymbol{d}_k\boldsymbol{Hd}_k}$
赋予ak。第10行计算迭代点
$\boldsymbol{x}_{k+1}=\boldsymbol{x}_k+\alpha_k\boldsymbol{d}_k$
更新xk。第11行计算
$\boldsymbol{g}_{k+1}=\boldsymbol{Hx}_{k+1}-\boldsymbol{b}$
更新gk。第12行按定理1计算组合系数
$\beta_k=\frac{\boldsymbol{g}_{k+1}^\top\boldsymbol{Hd}_k}{\boldsymbol{d}_k^\top\boldsymbol{Hd}_k}$
赋予bk。第13行按定理1计算共额方向
$\boldsymbol{d}_{k+1}=-\boldsymbol{g}_{k+1}+\beta_k\boldsymbol{d}_k$
更新dk。第14行将迭代次数自增1。循环往复，直至条件
$\lVert\boldsymbol{g}_k\rVert<\varepsilon$
成立为止。
第15~17行用 $f(\boldsymbol{x}_k)=\frac{1}{2}\boldsymbol{x}_k^\top\boldsymbol{Hx}_k-\boldsymbol{b}^\top\boldsymbol{x}_k+c$ ， $\boldsymbol{x}_k$ 和 $k$ 构造OptimizeResult对象（第2行导入）并返回。
例1 利用共轭梯度法计算正定二次型函数 $f(\boldsymbol{x})=\frac{5}{2}x_1^2+x_2^2-3x_1x_2-x_2-7$ 的最优解点 $\boldsymbol{x}_0\in\text{ℝ}^2$ ，给定初始点 $\boldsymbol{x}_1=\begin{pmatrix}0\\0\end{pmatrix}$ 。
解：目标函数的矩阵形式为
$f(\boldsymbol{x})=\frac{1}{2}\boldsymbol{x}^\top\boldsymbol{Hx}-\boldsymbol{x}^\top\boldsymbol{b}+c$
其中， $\boldsymbol{x}=\begin{pmatrix}x_1\\x_2\end{pmatrix}\in\text{ℝ}^2$ ， $\boldsymbol{H}=\begin{pmatrix}5&-3\\-3&2\end{pmatrix}$ ， $\boldsymbol{b}=\begin{pmatrix}0\\1\end{pmatrix}$ ， $c = 7$ 。下列代码完成计算。

import numpy as np                          #导入numpy
H=np.array([[5, -3],                        #设置Hesse阵
            [-3, 2]],dtype='float')
b=np.array([0,1],dtype='float')             #设置向量
c=7                                         #设置常数
x=np.array([0,0],dtype='float')             #设置初始迭代点
print(conjG(x,H,b,c))                       #计算并输出最优解

利用代码内的注释信息容易理解本程序代码。运行程序，输出

 fun: 4.5
 nit: 3
   x: array([3., 5.])

这意味着在 $\varepsilon=10^{-5}$ 的容错误差下，共轭梯度算法迭代3次算得正定二次型函数 $f(\boldsymbol{x})=\frac{5}{2}x_1^2+x_2^2-3x_1x_2-x_2-7$ 的最优解 $\boldsymbol{x}_0=\begin{pmatrix}3\\5\end{pmatrix}$ 。
写博不易，敬请支持：
如果阅读本文于您有所获，敬请点赞、评论、收藏，谢谢大家的支持！