The Optimal Control of Linear Quadratic System

最新推荐文章于 2023-04-21 08:16:42 发布

Vic_Hao

最新推荐文章于 2023-04-21 08:16:42 发布

阅读量444

点赞数

分类专栏： Optimal Control

本文链接：https://blog.csdn.net/weixin_42018112/article/details/102875395

版权

Optimal Control 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Formulation of LQS (Linear Quadratic System)

LQS的最优控制是

Linear指的是系统的状态方程是线性的。
Quadratic指的是代价函数是二次泛函。

设线性时变系统的状态方程为
$\dot{x(t)} = A(t)x(t) + B(t)u(t)$ $y (t) = C (t) x (t)$

假设控制向量 $u (t)$ 不受约束，用 $y_{r}(t)$ 表示期望输出，则误差向量为：
$e(t) = y_{r}(t) - y(t)$
目的是求最优控制 $u^{*}(t)$ ，使下列二次型性能指标最小：
$\frac{1}{2}e^{T}(t_{f})Fe(t_{f}) + \frac{1}{2} \int_{t_{0}}^{t_{f}} [e^{T}(t)Q(t)e(t) + u(t)^{T}R(t)u(t)]dt$

where
$F$ ——半正定对称常数加权矩阵
$Q (t)$ ——半正定对称时变加权矩阵
$R (t)$ ——正定对称时变加权矩阵
$t_{0}$ 及 $t_{f}$ 固定

$u^{*}(t)$ 是状态反馈控制器（区别于传统控制理论中的输出反馈控制器。状态反馈和输出反馈都能影响系统的稳定性。加入反馈，通过反馈构成的闭环系统成为稳定系统，这个过程称之为镇定。由于状态反馈具有很多优越性，且输出反馈系统总可以找到与之性能等同的状态反馈系统，故只需讨论状态反馈的镇定问题。）。

我们的目标是得到：
$u^{*}(t) = -K(t)x(t)$

性能指标的物理含义：
$L_{e} = \frac{1}{2}e(t)^{T}Q(t)e(t) \geqslant 0$ —— 状态转移过程中衡量 $e_{t}$ 大小的代价函数
$L_{u} = \frac{1}{2}u(t)^{T}R(t)u(t) > 0$ —— 状态转移过程中衡量 $u (t)$ 大小的代价函数
$\phi (t_{f}) = \frac{1}{2}e(t_{f})^{t}Fe(t_{f}) \geqslant 0$ —— 终端代价函数（衡量终点误差）
加权矩阵的意义：

$F, Q$ 是衡量误差分量的加权矩阵， $R$ 是衡量控制分量的加权矩阵，可根据各分量的重要性灵活选取。
采用时变矩阵 $Q (t), R (t)$ 更能适应各种特殊情况。（例如： $t=t_{0}$ 时刻 $e(t_{0})$ 很大，但误差在系统开始前形成，并不反应系统性能的好坏，此时 $Q (t)$ 可开始取值小，而后取值大。）

线性二次型系统的本质：
用不大的控制，来保持较小的误差，以达到能量和误差综合最优的目的。
线性二次型问题的三种重要情形：

状态调节器—— $C(t) = I, y_{r}(t) = 0, y(t) = x(t) = -e(t)$
输出调节器—— $y_{r}(t) = 0, y(t) = -e(t)$
跟踪问题—— $y_{r}(t) \neq 0, e(t) = y_{r}(t) - y(t)$

线性二次型问题的特点：
1.最优解可写成统一的解析表达式，实现求解过程规范化。
2.可以兼顾系统的性能指标（快速性、准确性、稳定性、灵敏度）。

状态调节器

planning, LQR, LQG就是这种问题形式。

终端时间 $\neq \infty$ —— 有限时间问题
终端时间 $\infty$ —— 无限时间问题

有限时间状态调节器问题

设线性时变系统的状态方程为
$\dot{x(t)} = A(t)x(t) + B(t)u(t)$
初始条件 $x(t_{0}) = x_{0}$ ，终端时间 $\neq \infty$
假设控制向量 $u (t)$ 不受约束，求最优控制 $u^{*}(t)$ ，使系统的二次型性能指标取极小值。
$\frac{1}{2}x^{T}(t_{f})Fx(t_{f}) + \frac{1}{2} \int_{t_{0}}^{t_{f}}[x^{T}(t)Q(t)x(t) + u^{T}(t)R(t)u(t)]dt$
- 物理意义
  以较小的控制能量为代价，使系统保持在零值附近。
无限时间状态调节器问题

设线性定常系统的状态方程为：
$\dot{x(t)} = Ax(t) + Bu(t)$
初始条件 $x(t_{0}) = x_{0}$ ，终端时间 $\infty$
假设控制向量 $u (t)$ 不受约束，求最优控制 $u^{*}(t)$ , 使系统的二次型性能指标取极小值。
$\frac{1}{2} \int^{\infty}_{t_{0}}[x^{T}(t)Qx(t) + u^{T}(t)Ru(t)]dt$
说明：
1.要求系统完全可控。
2. $F = 0$ ，人们所关心的总是系统在有限时间内的响应。

输出调节器

有限时间输出调节器

设线性时变系统的状态方程为
$\dot{x(t)} = A(t)x(t) + B(t)x(t)$ $y (t) = C (t) x (t)$
假设控制向量 $u (t)$ 不受约束，求最优控制 $u^{*}(t)$ , 使下列二次型性能指标最小。
$\frac{1}{2}y^{T}(t_{f})Fy(t_{f}) + \frac{1}{2} \int^{t_{f}}_{t_{0}}[y^{T}(t)Q(t)y(t) + u^{T}(t)R(t)u(t)]dt$
时间 $t_{0}$ 及 $t_{f}$ 固定，系统完全可观测。
- 物理意义
  以较小的控制能量为代价，使输出保持在零值附近。
根据系统能观条件，输出调节器问题可以转化为状态调节器问题。
无限时间输出调节器

设线性定常系统的状态方程为
$\dot{x(t)} = Ax(t) + Bu(t)$ $y (t) = C x (t)$

假设控制向量 $u (t)$ 不受约束，求最优控制 $u^{*}(t)$ ，使得下列二次型性能指标最小：
$\frac{1}{2} \int_{t_{0}}^{\infty}[y^{T}(t)Qy(t) + u^{T}(t)Ru(t)]dt$
终端时间 $t_{f} \rightarrow \infty$ ，系统完全能控且完全可观测。

跟踪器

线性时变系统的跟踪问题
线性定常系统的跟踪问题

Reference

LQR (Linear Quadratic Regulator)

LQR可以得到状态线性反馈的最优控制规律。
wiki

LQG (Linear Quadratic Gaussian)

LQG = LQR + Kalman Filter

连续时间

考虑连续时间的线性动态系统：
$\dot{x(t)} = A(t)x(t) + B(t)u(t) + v(t)$ $y (t) = C (t) x (t) + w (t)$ 其中，系统受到加成性的高斯系统噪声 $v (t)$ 和加成性的高斯量测噪声 $w (t)$ 影响。
控制目标就是求控制输入 $u (t)$ , 使得下列二次型性能指标最小：
$\mathbb{E} [x^{T}(t_{f})Fx(t_{f}) + \int_{t_{0}}^{t_{f}}[x^{T}(t)Q(t)x(t) + u^{T}(t)R(t)u(t)]dt]$
最终时间 $t_{f}$ 可以是有限值也可以是无限值。
若最终时间为无限值，则代价函数的第一项可以忽略。
$\mathbb{E} [ \int_{t_{0}}^{t_{f}}[x^{T}(t)Q(t)x(t) + u^{T}(t)R(t)u(t)]dt]$