2 离散系统最优控制
说明:
在前述静态到动态的推广下,我们发现:
(1)终端状态固定情况导致的开环策略;
(2)终端状态不固定导致的闭环策略。
进一步地,研究满足二次型表达形式的离散系统的最优控制问题。
2.2 离散系统最优控制的二次型
(2.2-1)目标:
对于系统(物理约束f):
将性能指标写成二次型的形式:
(这里,假设intermediate-state weighting matrices
Q
k
Q_k
Qk、cost-weighting matrices
R
k
R_k
Rk和
S
N
S_N
SN是对称的半正定矩阵,并且
∀
k
\forall k
∀k,
∣
R
k
∣
=
0
|R_k|=0
∣Rk∣=0)
目标仍然是在已知 x 0 x_0 x0的前提下,找到时间 [ i , N ] [i,N] [i,N]上的控制序列 u i , u i + 1 , . . . , u N − 1 u_i,u_{i+1},...,u_{N−1} ui,ui+1,...,uN−1,使 J i J_i Ji最小(linear quadratic regulator problem)
(2.2-2)解决方法概述:
从Hamilton函数开始:
由上一篇文章中的求解顺序:
可以得到最优控制序列跟协状态有关:
再将该最优控制序列代入式(2.2-4)可以求出系统状态的表达式:
为了解决控制问题,需要知道协状态
λ
k
+
1
\lambda_{k+1}
λk+1。
但此处的问题是:状态式(2.2-8)和协状态式(2.2-5)在时间上分别是前向递归和后向递归的,很难求解。
由于对连续系统采样,无论何时 ∣ A ∣ ≠ 0 |A|\neq0 ∣A∣=0,故可以将两式改写成:
这是后向递归的形式,因此当知道
x
N
x_N
xN和
λ
N
\lambda_N
λN时,可以求出
x
k
x_k
xk,
λ
k
\lambda_k
λk。
在这种情况下,我们就有了 x N x_N xN已知和未知两种讨论情况。
(2.2-3)分析(研究零输入时):
说明:
这是一种常见的分析思想,在零输入情况下分析系统参量的内在关系,以期找到一些规律。
关于状态和协状态的分析:
对
假设
u
k
=
0
u_k=0
uk=0且
Q
k
=
0
Q_k=0
Qk=0时,状态和协状态关系式变为:
x
k
+
1
=
A
x
k
x_{k+1}=Ax_k
xk+1=Axk
λ
k
=
A
T
λ
k
+
1
\lambda_k=A^T\lambda_{k+1}
λk=ATλk+1
其解:
因此可以推出:
λ k T x k = λ N T A N − k A k x 0 = λ N T A N x 0 = λ N T x N \lambda_k^Tx_k=\lambda_N^TA^{N-k}A^kx_0=\lambda_N^TA^Nx_0=\lambda_N^Tx_N λkTxk=λNTAN−kAkx0=λNTANx0=λNTxN
这说明在零输入和零中间态权重的情况下,状态和协状态的内积是一个常数。
对于指标函数的分析:
由:
在上述前提下( u k = 0 u_k=0 uk=0且 Q k = 0 Q_k=0 Qk=0),性能指标 J N J_N JN变为:
基于此进行
J
i
J_i
Ji的后向递推:
将 x k + 1 = A k x k x_{k+1}=A_kx_k xk+1=Akxk代入上式可得:
进而可以得到类似于
J
N
J_N
JN表达形式的中间变量:
对于
i
=
N
−
2
,
N
−
3
,
.
.
.
,
0
i=N-2,N-3,...,0
i=N−2,N−3,...,0等都成立,故进而推出统一的表达形式,称之为discrete Lyapunov equation或者observablity Lyapunov equation,也称为性能指标内核序列:
因此,性能指标也可以改写成如下形式:
对于内核序列的分析:
P a g e 116 − P a g e 119 Page_{116}-Page_{119} Page116−Page119
(2.2-4)疑问:
为啥假定 Q k = 0 Q_k=0 Qk=0?