2023-09-30-连续系统的LQR变分法推导

xinyu_khan

已于 2024-02-21 17:39:41 修改

阅读量380

点赞数 4

分类专栏：知识分享文章标签：机器人算法自动驾驶自动化

于 2024-02-21 16:44:32 首次发布

本文链接：https://blog.csdn.net/hxy_1993_08_18/article/details/136215528

版权

连续系统的LQR变分法推导

优化控制问题

考虑下述优化问题：

$\begin{aligned} J=h(x(t_f),t_f)+\int_{t_0}^{t_f}g(x(t),u(t),t)dt\\ \text{subject to}\quad&\dot{x}(t)=a(x(t),u(t),t)\\ &t_0,x(t_0)&\quad\text{fixed}\\ &t_f&\quad\text{free}\\ &x(t_f)&\quad\text{free or fixed} \end{aligned} \tag{1}$

其中 $\dot{x}(t)=a(x(t),u(t),t)$ 可以被看作一种约束，因此我们定义拉格朗日乘子 $p (t)$ ，同时对原有的代价函数 $J$ 进行增广，得到如下增广代价函数：

$J_a=h(x(t_f),t_f)+\int_{t_0}^{t_f}[g(x(t),u(t),t)+p(t)^T\{a(x(t),u(t),t)-\dot{x}(t)\}]dt \tag{2}$

对 $J_a$ 取变分（Variation），得到如下表达式：

$\delta J_a=h_{x_f}\delta x_f+h_{t_f}\delta t_f+\int_{t_0}^{t_f}[g_x\delta x+g_u\delta u+(a-\dot{x})^T\delta p(t)+p^T(t){a_x\delta x+a_u\delta u-\delta\dot{x}}]dt+[g+p^T(a-\dot{x})](t_f)\delta t_f \tag{3}$

其中：

$\begin{aligned} x_f&=x(t_f)\\ \dot x_f&=\dot x(t_f)\\ u_f&=u(t_f)\\ p_{f}&=p(t_f)\\ h_{x_f} &= \frac{\partial h(x,t)}{\partial x}(x_f,t_f)\\ h_{tf} &= \frac{\partial h(x,t)}{\partial t}(x_f,t_f)\\ g_x&=\frac{\partial g(x,u,t)}{\partial x}\\ g_u&=\frac{\partial g(x,u,t)}{\partial u}\\ [g+p^T(a-\dot x)](t_f)&=g(x_f,u_f,t_f)+p^T_f(a(x_f,u_f,t_f)-\dot x_f) \end{aligned} \tag{4}$

下面我们定义哈密顿量（Hamiltonian）：

$H(x,u,p,t)=g(x(t),u(t),t)+p^T(t)a(x(t),u(t),t) \tag{5}$

将定义的哈密顿量代入到公式（3）的变分中可以得到：

$\begin{aligned} \delta J_a&=h_{x_f}\delta x_f+[h_{t_f}+g+p^T(a-\dot x)](t_f)\delta t\\ &+\int_{t_0}^{t_f}[H_x\delta x+H_u\delta u+(a-\dot x)^T\delta p(t)\underbrace{-p^T(t)\delta\dot x}_{(6.1)}]dt \end{aligned} \tag{6}$