【最优化期末复习】F-R共轭方向法

一、共轭

Q Q Q n × n n\times n n×n 对称正定矩阵,若 n n n 维向量空间中非零向量 p ⃗ 0 , p ⃗ 1 , ⋯   , p ⃗ m \vec{p}_0,\vec{p}_1,\cdots,\vec{p}_m p 0,p 1,,p m 满足:
对于任意的 i , j ∈ { 0 , 1 , 2 , ⋯   , m } ∧ i ≠ j i,j\in\{0,1,2,\cdots,m\}\wedge i\neq j i,j{0,1,2,,m}i=j,如果: p ⃗ i   T Q p ⃗ j = 0 \vec{p}^{\rm \space T}_iQ\vec{p}_j=0 p i TQp j=0,则称这些向量是 Q Q Q 的共轭向量。

Q = E Q=E Q=E 时,说明向量是正交的,由此可知,正交是一种特殊的共轭。

我对线性流形的概念,感觉跟生成子空间类似,不知道这种理解对不对。。。

二、初始条件

初始点: x ⃗ 0 \vec{x}_0 x 0

目标函数: f ( x ⃗ ) f(\vec{x}) f(x )

目标函数梯度: g ⃗ ( x ⃗ ) = ∇ f ( x ⃗ ) \vec{g}(\vec{x})=\nabla f(\vec{x}) g (x )=f(x )

初始方向: p ⃗ 0 = − g ⃗ 0 \vec{p}_0=-\vec{g}_0 p 0=g 0

三、迭代

x ⃗ k + 1 = x ⃗ k + t k p ⃗ k \vec{x}_{k+1}=\vec{x}_k+t_k\vec{p}_k x k+1=x k+tkp k

p ⃗ k = − g ⃗ k + α k − 1 p ⃗ k − 1      ( k > 0 , k ∈ Z ) \vec{p}_k=-\vec{g}_k+\alpha_{k-1}\vec{p}_{k-1}\space\space\space\space(k>0,k\in Z) p k=g k+αk1p k1    (k>0,kZ)

α k − 1 = ∣ ∣ g ⃗ k ∣ ∣ 2 ∣ ∣ g ⃗ k − 1 ∣ ∣ 2 \alpha_{k-1}=\frac{||\vec{g}_k||^2}{||\vec{g}_{k-1}||^2} αk1=∣∣g k12∣∣g k2

对于正定二次函数,有: t k = g ⃗ k T g ⃗ k p ⃗ k T Q p ⃗ k t_k=\frac{\vec{g}_k^T\vec{g}_k}{\vec{p}^T_kQ\vec{p}_k} tk=p kTQp kg kTg k

四、例子

m i n x 1 2 + x 2 2 − x 1 2 x 2 {\rm min} x_1^2+x_2^2-x_1^2x_2 minx12+x22x12x2,初始点 x 0 = [ 1 , 1 ] T x_0=[1,1]^{\rm T} x0=[1,1]T,迭代两次求 x ⃗ 2 \vec{x}_2 x 2

解:令 f ( x ⃗ ) = x 1 2 + x 2 2 − x 1 2 x 2 f(\vec{x})=x_1^2+x_2^2-x_1^2x_2 f(x )=x12+x22x12x2,则:
g ⃗ ( x ⃗ ) = ∇ f ( x ⃗ ) = [ 2 x 1 − 2 x 1 x 2 , 2 x 2 − x 1 2 ] T \vec{g}(\vec{x})=\nabla f(\vec{x})=[2x_1-2x_1x_2,2x_2-x_1^2]^{\rm T} g (x )=f(x )=[2x12x1x2,2x2x12]T进而: g ⃗ 0 = ∇ f ( x ⃗ 0 ) = [ 0 , 1 ] T \vec{g}_0=\nabla f(\vec{x}_0)=[0,1]^{\rm T} g 0=f(x 0)=[0,1]T. 取 p ⃗ 0 = − g ⃗ 0 \vec{p}_0=-\vec{g}_0 p 0=g 0,有 x ⃗ 1 = x ⃗ 0 − t g ⃗ 0 = [ 1 , 1 − t ] T \vec{x}_1=\vec{x}_0-t\vec{g}_0=[1,1-t]^{\rm T} x 1=x 0tg 0=[1,1t]T f ( x ⃗ 1 ) = ϕ 1 ( t ) = 1 + ( 1 − t ) 2 − ( 1 − t ) = ( 1 − t ) 2 + t f(\vec{x}_1)=\phi_1(t)=1+(1-t)^2-(1-t)=(1-t)^2+t f(x 1)=ϕ1(t)=1+(1t)2(1t)=(1t)2+t ϕ 1 ′ ( t ) = − 2 ( 1 − t ) + 1 = 2 t − 1 \phi_1^\prime(t)=-2(1-t)+1=2t-1 ϕ1(t)=2(1t)+1=2t1 ϕ 1 ′ ( t ) = 0 \phi_1^\prime(t)=0 ϕ1(t)=0,得: t = 1 2 t=\frac{1}{2} t=21,所以: x 1 = [ 1 , 1 2 ] T x_1=[1,\frac{1}{2}]^{\rm T} x1=[1,21]T

进而: g ⃗ 1 = ∇ f ( x ⃗ 1 ) = [ 1 , 0 ] T \vec{g}_1=\nabla f(\vec{x}_1)=[1,0]^{\rm T} g 1=f(x 1)=[1,0]T α 0 = ∣ ∣ g ⃗ 1 ∣ ∣ 2 ∣ ∣ g ⃗ 0 ∣ ∣ 2 = 1 \alpha_0=\frac{||\vec{g}_1||^2}{||\vec{g}_0||^2}=1 α0=∣∣g 02∣∣g 12=1 p ⃗ 1 = − g ⃗ 1 + α 0 p ⃗ 0 = − g ⃗ 1 − g ⃗ 0 = [ − 1 , − 1 ] T \vec{p}_1=-\vec{g}_1+\alpha_0\vec{p}_0=-\vec{g}_1-\vec{g}_0=[-1,-1]^{\rm T} p 1=g 1+α0p 0=g 1g 0=[1,1]T x ⃗ 2 = x ⃗ 1 + t p ⃗ 1 = [ 1 − t , 1 2 − t ] T \vec{x}_2=\vec{x}_1+t\vec{p}_1=[1-t,\frac{1}{2}-t]^{\rm T} x 2=x 1+tp 1=[1t,21t]T f ( x ⃗ 2 ) = ϕ 2 ( t ) = ( 1 − t ) 2 + ( 1 2 − t ) 2 − ( 1 − t ) 2 ( 1 2 − t ) f(\vec{x}_2)=\phi_2(t)=(1-t)^2+(\frac{1}{2}-t)^2-(1-t)^2(\frac{1}{2}-t) f(x 2)=ϕ2(t)=(1t)2+(21t)2(1t)2(21t) ϕ 2 ′ ( t ) = 3 t 2 − t − 1 \phi_2^\prime(t)=3t^2-t-1 ϕ2(t)=3t2t1 ϕ 2 ′ ( t ) = 0 \phi_2^\prime(t)=0 ϕ2(t)=0,得: t = 1 + 13 6 t=\frac{1+\sqrt{13}}{6} t=61+13 ,于是: x ⃗ 2 = [ 5 − 13 6 , 2 − 13 6 ] T \vec{x}_2=[\frac{5-\sqrt{13}}{6},\frac{2-\sqrt{13}}{6}]^{\rm T} x 2=[6513 ,6213 ]T

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值