控制算法之二：LQR控制

学习路上的Worker

于 2024-11-17 12:26:23 发布

阅读量3.2k

点赞数 26

文章标签：自动化自动驾驶

本文链接：https://blog.csdn.net/weixin_40046251/article/details/143787169

版权

1.前言

线性二次调节（Linear Quadratic Regulator，LQR）是一种经典的现代控制理论方法，用于构造线性系统的最优控制器，它的目标是在控制系统的动态过程中，尽可能减少误差和能耗。LQR 的目标是通过最优控制输入，使系统状态最小化某一代价函数（即性能指标），以实现最佳控制。

2.应用场景

LQR 广泛用于工业控制、自动驾驶、航天器姿态控制、无人机控制等场景，特别是那些需要平衡控制精度和能量消耗的系统。

3.系统方程

对于一个系统 $\dot{x} = Ax + Bu$ ，假设设计状态反馈控制器 $u = -Kx$ ，将控制输入带入系统方程中，则可以得到：

$\dot{x} = (A - BK) x = A_{mex} x$ ......................................................................................................(1)

由于让系统稳定的条件是矩阵 $^{A_{mex}}$ 特征值的实部全为负的，其实设计一个控制律使系统稳定并不难，我们可以随便找几个具有负实部的特征值，从而得到系统的特征方程，然后利用待定系数，从而得到K值，利用这种方法，我们其实可以得到好多控制量。但是，如果我们想得到一个好的或者最优的控制量，那怎么办呢？

这里，就引出了代价函数的定义：

$J = \int_{0}^{\infty }(x^{T}Qx + u^{T}Ru) dt$ ....................................................................................................(2)

其中，Q 和 R 是两个对角参数矩阵，分别决定了状态向量 x 和输入向量 u 的重要性。显然，J是一个二次型函数，这也是LQR中“Q”的由来

4. 代价函数的意义

考虑一个双变量系统，即 $x = \begin{bmatrix} x_{1}\\ x_{2} \end{bmatrix}$ , 则控制器设计为 $u = \begin{bmatrix} k{_{1}} & k{_{2}} \end{bmatrix} * \begin{bmatrix} x{_{1}}\\ x{_{2}} \end{bmatrix} = -k_{1}* x_{1}-k_{2}* x_{2}$

假设 $Q = \begin{bmatrix} q_{1}& 0\\0 & q_{2} \end{bmatrix}$ , $R = r$ , 则代价函数可以写成：

$J = \int_{0}^{\infty } (q_{1}x_{1}^2{}+q_{2}x_{1}^2{}+ru^{2})dt$ ...............................................................................................(3)

如果令 $q_{1}>q_{2}>r$ ，则状态变量 $x{_{1}}$ 在代价函数的占比最大， $x{_{1}}$ 的收敛速度较快；反之， $r>q_{1}>q_{2}$ ，则说明 $u$ 的占比最大，如果想要使代价函数最小，则控制量需要最小，这也就意味着更加节省能量。

接下来，就是如何来确定 $K$ 。

5.LQR控制器的设计

将控制律 $u = -Kx$ 代入(2)，可得代价函数：

$J = \int_{0}^{\infty }[x^{T}(Q+K^{T}RK)x]dt$ ...............................................................................................(4)

定义一个常量对称矩阵 $P = P^{T} > 0$ ，且矩阵满足：

$\frac{\mathrm{d} }{\mathrm{d} x}(x^{T}Px) = -x^{T}(Q+K^{T}RK)x$ .........................................................................................(5)

由式(4)和(5)可得：

$J =- \int_{0}^{\infty }[\frac{\mathrm{d} }{\mathrm{d} x}(x^{T}Px)]dt = -(x^{T}Px|_{\infty }-x^{T}Px|_{0 }) =x^{T}(0)Px(0)$ ...............................(6)