最优化方法Python计算：正定二次型基本共轭方向算法

戌崂石

已于 2023-08-18 14:37:17 修改

阅读量399

点赞数

分类专栏：最优化方法文章标签： python 最优化方法

于 2023-08-17 10:55:23 首次发布

本文链接：https://blog.csdn.net/u012958850/article/details/132334908

版权

最优化方法专栏收录该内容

26 篇文章 5 订阅

订阅专栏

设目标函数
$f(\boldsymbol{x})=\frac{1}{2}\boldsymbol{x}^\top\boldsymbol{Hx}-\boldsymbol{x}^\top\boldsymbol{b},\boldsymbol{x}\in\text{ℝ}^n.$
其中， $\boldsymbol{H}\in\text{ℝ}^{n\times n}$ 为对称正定矩阵， $\boldsymbol{b}\in\text{ℝ}^n$ 为一常向量。即 $f(\boldsymbol{x})$ 为一二次型函数，且 $\nabla f(\boldsymbol{x})=\boldsymbol{Hx}-\boldsymbol{b}$ ， $\nabla^2f(\boldsymbol{x})=\boldsymbol{H}$ 。由于 $\boldsymbol{H}=\nabla^2f(\boldsymbol{x})$ 正定，故 $f(\boldsymbol{x})$ 有唯一的最小值点 $\boldsymbol{x}_0$ （满足 $\boldsymbol{o}=\nabla f(\boldsymbol{x}_0)=\boldsymbol{Hx}_0-\boldsymbol{b}$ 或 $\boldsymbol{Hx}_0=\boldsymbol{b}$ ）。
定理1 二次型目标函数
$f(\boldsymbol{x})=\frac{1}{2}\boldsymbol{x}^\top\boldsymbol{Hx}-\boldsymbol{x}^\top\boldsymbol{b},\boldsymbol{x}\in\text{ℝ}^n$
其中， $\boldsymbol{H}\in\text{ℝ}^{n\times n}$ 为正定矩阵。 $\boldsymbol{d}_1,\boldsymbol{d}_2,\cdots,\boldsymbol{d}_n$ 为 $f(\boldsymbol{x})$ 的共轭方向向量（详见博文《最优化方法Python计算：构造正定矩阵的共轭向量》），任取 $\boldsymbol{x}_1\in\text{ℝ}^n$ ，对 $1\leq k\leq n$ 令 $\alpha_k=-\frac{\nabla f(\boldsymbol{x}_k)^\top\boldsymbol{d}_k}{\boldsymbol{d}_k^\top\boldsymbol{Hd}_k}$ ，构造迭代式
$\boldsymbol{x}_{k+1}=\boldsymbol{x}_k+\alpha_{k}\boldsymbol{d}_{k}$
则存在 $1\leq m\leq n+1$ ，使得 $\boldsymbol{x}_{m}=\boldsymbol{x}_{m+1}=\cdots=\boldsymbol{x}_{n+1}=\boldsymbol{x}_0$ 。其中 $\boldsymbol{x}_0$ 为 $f(\boldsymbol{x})$ 的最优解点。
利用定理1，可建立计算二次型目标函数最优解的基本共轭方向算法。下列Python函数实现该算法。

import numpy as np                          #导入numpy
from scipy.optimize import OptimizeResult   #导入OptimizeResult
def conj(x1,H,b,c,gtol=1e-5):               #基本共轭方向算法实现函数
    d=conjugation(H)                        #构造H的共轭向量组
    xk=x1                                   #初始迭代点
    gk=(np.matmul(H,xk)-b)                  #计算梯度
    k=1
    while np.linalg.norm(gk)>=gtol:         #只要梯度不为0
        ak=-np.matmul(gk,d[:,k-1])/np.matmul(np.matmul(d[:,k-1],H),d[:,k-1])
        xk+=ak*d[:,k-1]
        gk=(np.matmul(H,xk)-b)
        k+=1
    bestx=xk
    besty=(np.matmul(np.matmul(xk,H),xk)/2-np.matmul(b,xk))+c
    return OptimizeResult(fun=besty, x=bestx, nit=k)

程序的第3~15行定义实现基本共轭方向法的conj函数，参数x1表示初始迭代点 $\boldsymbol{x}_1$ ，H、b和c分别表示二次型函数
$f(\boldsymbol{x})=\frac{1}{2}\boldsymbol{x}^\top\boldsymbol{Hx}-\boldsymbol{x}^\top\boldsymbol{b}+c$
中的矩阵 $\boldsymbol{H}$ 、向量 $\boldsymbol{b}$ 和常数 $c$ ，gtol表示容错误差 $\varepsilon$ ，缺省值为 $10^{-5}$ 。
第4~7行执行初始化操作：第4行调用博文《最优化方法Python计算：构造正定矩阵的共轭向量》中定义的构造正定矩阵共轭向量组的函数conjugation，构造 $\boldsymbol{H}$ 的共轭向量组
$\boldsymbol{d}_1,\boldsymbol{d}_2,\cdots,\boldsymbol{d}_n$
存储于d。第5行设置迭代点xk初始化为x1。第6行计算目标函数的当前梯度
$\boldsymbol{g}_1=\boldsymbol{Hx}_1-\boldsymbol{b}$
赋予gk。第7行将迭代次数k初始化为1。\par
第8~12行的while循环作迭代操作：第9行计算
$\alpha_k=-\frac{\boldsymbol{g}_k^\top\boldsymbol{d}_k}{\boldsymbol{d}_k^\top\boldsymbol{Hd}_k}$
赋予ak。第10行用
$\boldsymbol{x}_k+\alpha_k\boldsymbol{d}_k$
更新xk。第11行用xk更新梯度gk。第12行迭代次数k自增1。循环往复，直至条件
$\lVert\boldsymbol{g}(\boldsymbol{x}_k)\rVert<10^{-5}$
（ $\boldsymbol{g}(\boldsymbol{x}_k)$ 近似为 $\boldsymbol{o}$ ）成立。需要注意的是于Python数组的下标是从0开始编码的，故在第9、10行中k作为数组下标时表示为k-1。
第13~15行用 $f(\boldsymbol{x}_k)$ ， $\boldsymbol{x}_k$ 及 $k$ 构造OptimizeResult（第2行导入）对象，并返回。
例1 用函数conj计算正定二次型函数 $f(\boldsymbol{x})=\frac{3}{2}x_1^2+2x_2^2+\frac{3}{2}x_3^2+x_1x_3+2x_2x_3-3x_1-x_3$ 的最优解。给定初始点 $\boldsymbol{x}_1=\begin{pmatrix}0\\0\\0\end{pmatrix}$ ，容错误差 $\varepsilon=10^{-5}$ 。
解： $f(\boldsymbol{x})$ 的矩阵形式 $f(\boldsymbol{x})=\frac{1}{2}\boldsymbol{x}^\top\boldsymbol{Hx}-\boldsymbol{x}^\top\boldsymbol{b}+c$ 中， $\boldsymbol{H}=\begin{pmatrix}3&0&1\\0&4&2\\1&2&3\end{pmatrix}$ ， $\boldsymbol{b}=\begin{pmatrix}3\\0\\1\end{pmatrix}$ ， $c = 0$ 。下列代码完成计算。

import numpy as np                          #导入numpy
H=np.array([[3,0,1],                        #设置Hesse阵
            [0,4,2],
            [1,2,3]],dtype='float')
b=np.array([3,0,1],dtype='float')           #设置向量
x=np.array([0,0,0],dtype='float')           #设置初始点
c=0                                         #设置常量
print(conj(x,H,b,c))                        #计算并输出最优解

借助代码内部的注释信息，不难理解本程序。需要注意的是，由于给定的容错误差为 $\varepsilon=10^{-5}$ ，故调用conj时使用参数gtol的缺省值。运行程序，输出

 fun: -1.5
 nit: 2
   x: array([1., 0., 0.])

这意味着在 $\varepsilon=10^{-5}$ 的容错误差下，迭代2次即算得 $f(\boldsymbol{x})$ 的最优解 $\boldsymbol{x}_0=\begin{pmatrix}1\\0\\0\end{pmatrix}$ 。

戌崂石

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
最优化方法Python计算：正定二次型基本共轭方向算法

基本共轭方向算法
复制链接

扫一扫

专栏目录

最优化方法Python计算：正定二次型基本共轭方向算法

“相关推荐”对你有帮助么？