【最优控制笔记】——2离散系统二次型最优控制

2 离散系统最优控制

说明:

在前述静态到动态的推广下,我们发现:

(1)终端状态固定情况导致的开环策略;
(2)终端状态不固定导致的闭环策略。

进一步地,研究满足二次型表达形式的离散系统的最优控制问题。

2.2 离散系统最优控制的二次型

(2.2-1)目标:

对于系统(物理约束f):

在这里插入图片描述
将性能指标写成二次型的形式:

在这里插入图片描述
(这里,假设intermediate-state weighting matrices Q k Q_k Qk、cost-weighting matrices R k R_k Rk S N S_N SN是对称的半正定矩阵,并且 ∀ k \forall k k ∣ R k ∣ = 0 |R_k|=0 Rk=0

目标仍然是在已知 x 0 x_0 x0的前提下,找到时间 [ i , N ] [i,N] [i,N]上的控制序列 u i , u i + 1 , . . . , u N − 1 u_i,u_{i+1},...,u_{N−1} ui,ui+1,...,uN1,使 J i J_i Ji最小(linear quadratic regulator problem)

(2.2-2)解决方法概述:

从Hamilton函数开始:

在这里插入图片描述
由上一篇文章中的求解顺序:

在这里插入图片描述
在这里插入图片描述
可以得到最优控制序列跟协状态有关:

在这里插入图片描述
再将该最优控制序列代入式(2.2-4)可以求出系统状态的表达式:

在这里插入图片描述

为了解决控制问题,需要知道协状态 λ k + 1 \lambda_{k+1} λk+1
此处的问题是:状态式(2.2-8)和协状态式(2.2-5)在时间上分别是前向递归和后向递归的,很难求解。

由于对连续系统采样,无论何时 ∣ A ∣ ≠ 0 |A|\neq0 A=0,故可以将两式改写成:

在这里插入图片描述
这是后向递归的形式,因此当知道 x N x_N xN λ N \lambda_N λN时,可以求出 x k x_k xk λ k \lambda_k λk

在这种情况下,我们就有了 x N x_N xN已知和未知两种讨论情况

(2.2-3)分析(研究零输入时):

说明:

这是一种常见的分析思想,在零输入情况下分析系统参量的内在关系,以期找到一些规律。

关于状态和协状态的分析:

在这里插入图片描述
假设 u k = 0 u_k=0 uk=0 Q k = 0 Q_k=0 Qk=0时,状态和协状态关系式变为:

x k + 1 = A x k x_{k+1}=Ax_k xk+1=Axk
λ k = A T λ k + 1 \lambda_k=A^T\lambda_{k+1} λk=ATλk+1

其解:

在这里插入图片描述

因此可以推出:

λ k T x k = λ N T A N − k A k x 0 = λ N T A N x 0 = λ N T x N \lambda_k^Tx_k=\lambda_N^TA^{N-k}A^kx_0=\lambda_N^TA^Nx_0=\lambda_N^Tx_N λkTxk=λNTANkAkx0=λNTANx0=λNTxN

这说明在零输入和零中间态权重的情况下,状态和协状态的内积是一个常数

对于指标函数的分析:

由:

在这里插入图片描述

在上述前提下( u k = 0 u_k=0 uk=0 Q k = 0 Q_k=0 Qk=0),性能指标 J N J_N JN变为:

在这里插入图片描述
基于此进行 J i J_i Ji的后向递推:

在这里插入图片描述

x k + 1 = A k x k x_{k+1}=A_kx_k xk+1=Akxk代入上式可得:

在这里插入图片描述
进而可以得到类似于 J N J_N JN表达形式的中间变量:

在这里插入图片描述
对于 i = N − 2 , N − 3 , . . . , 0 i=N-2,N-3,...,0 i=N2,N3,...,0等都成立,故进而推出统一的表达形式,称之为discrete Lyapunov equation或者observablity Lyapunov equation,也称为性能指标内核序列

在这里插入图片描述
因此,性能指标也可以改写成如下形式:

在这里插入图片描述

对于内核序列的分析:

P a g e 116 − P a g e 119 Page_{116}-Page_{119} Page116Page119

(2.2-4)疑问:

为啥假定 Q k = 0 Q_k=0 Qk=0

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值