最优控制LQR求解

最新推荐文章于 2023-10-26 10:53:21 发布

dyl74500196

最新推荐文章于 2023-10-26 10:53:21 发布

阅读量1.6w

点赞数 25

分类专栏：最优控制文章标签：最优控制 LQR 推导

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dyl74500196/article/details/77533827

版权

最优控制专栏收录该内容

1 篇文章 1 订阅

订阅专栏

LQR

Problem

x t + 1 = A x k + B u k

$\large{x_{t+1} = A x_k + B_{u_k} }$

x k : s t a t e a t t i m e t u k : i n p u t a t t i m e t

$x_k : state\ at \ time \ t \\ u_k:input \ at \ time \ t \\$

It assumes a quadratic cost function :

J = \sum n = 0 N - 1 (x T n Q x n + u T n R u n) + x N P x N

$\large{J = \sum_{n=0}^{N-1} \ (\ x_n^TQx_n + u_n^TRu_n \ ) \ + \ x_NPx_N}$

with $Q, R, P$ 正定

这里讨论的求解lqr是，在有模型的约束下面，以及初始条件 $x_0$ , 求解使性能指标最小的u 以及 x

求解过程，迭代求解

先定义cost-to-go function

J i (x i) = \sum n = i N - 1 (x T n Q x n + u T n R u n) + x T N P x N

$\large{J_i(x_i) = \sum_{n=i}^{N-1}(x_n^TQx_n + u_n^TRu_n) + x_N^TPx_N}$

可以理解为从第i时刻开始以初始条件为 $x_i$ 到最后产生的性能指标

推导的思想采用动态规划的思想，就是如果想要 $J$ 最小，我们可以通过迭代求解cost-to-go function的最小值来实现。

那么可以很简单的推导为：

J N (x N) = x T N P x N J N - 1 (x N - 1) = x T N - 1 Q x N - 1 + u T N - 1 R u N - 1 + J N (x N)

$\large{J_N(x_N) = x_N^TPx_N} \\ \large{J_{N-1}(x_{N-1}) = x_{N-1}^TQx_{N-1} + u_{N-1}^T R u_{N-1} + J_N(x_N)}$

这里再把模型的约束 $\large{x_{t+1} = A x_k + B_{u_k} }$ 带入可以得到

J N - 1 (x N - 1) = x T N - 1 Q x N - 1 + u T N - 1 R u N - 1 + J N (A x N - 1 + B u N - 1) (1)

$\large{J_{N-1}(x_{N-1}) = x_{N-1}^TQx_{N-1} + u_{N-1}^T R u_{N-1} + J_N(Ax_{N-1} + Bu_{N-1})} \ \ \ \ \ \ \ \ \ \ \ (1)$

为了推导方便，这里将（1）中的 $x_{N-1} , u_{N-1}$ 替换成 $x, u$

那么：

J N - 1 (x) = x T Q x + u T R u + (A x + B u) T P (A x + B u) (2)

$\large{J_{N-1}(x)= x^TQx + u^T R u + (Ax + Bu)^TP(Ax+Bu)} \ \ \ \ \ \ \ \ \ \ \ (2)$

将（2）对u求梯度然后令其为0可以得到：

\nabla u {(2)} = 2 R u + 2 B T P (A x + B u) = 0

$\large{\nabla_u\{(2)\} = 2Ru + 2B^TP(Ax + Bu)} =0$

u = - (R + B T P B) - 1 B T P A x (3)

$\large{ u = -(R + B^TPB)^{-1}B^TPAx \ \ \ \ \ \ \ \ \ \ (3)}$

将（3）带入（2），令 $(R + B^TPB)^{-1}B^TPA = k$ ，即 $u=-kx$

J N - 1 (x) = x T P^x P^= Q + k T R k + (A - B k) T P (A - B k)

$\large{J_{N-1}(x) = x^T \hat{P}x} \\ \large{\hat{P} = Q+k^TRk } +(A-Bk)^TP(A-Bk)$

这里可以看到求解后发现， $J_{N-1}$ 最后也可以写成 $x^TPx$ 的形式，只是P要更新，所以可以迭代的像后面求解，而且结果都是统一的形式

求解结果

loop for i = N-1 : i>=0 : i–

k = (R + B T P B) - 1 B T P A u i = - k x P = Q + k T R k + (A - B k) T P (A - B k)

$\large{k =( R + B^TPB)^{-1}B^TPA \\ u_i = -k x \\ P = Q+k^TRk +(A-Bk)^TP(A-Bk) }$

这样迭代完毕后会得到 ${\{u_0 , u_1 , ... , u_{N-1}\}}$

关注

25
点赞
踩
92

收藏

觉得还不错? 一键收藏
7
评论
最优控制LQR求解

LQRProblemxt+1=Axk+Buk\large{x_{t+1} = A x_k + B_{u_k} }xk:state at time tuk:input at time tx_k : state\ at \ time \ t \\u_k:input \ at \ time \ t \\It assumes a quadratic cost function :J=∑n=0N
复制链接

扫一扫

专栏目录

dyl74500196 CSDN认证博客专家 CSDN认证企业博客

码龄10年

3: 原创

53万+: 周排名

60万+: 总排名

3万+: 访问

: 等级

349: 积分

35: 粉丝

66: 获赞

24: 评论

181: 收藏

私信

关注

热门文章

分类专栏

最优控制 1篇

最新评论

四轴mpu6050姿态角卡尔曼滤波代码分析
2401_84097817: 有个问题，陀螺仪和加速度计测量的都是三个数，为什么都只有一个输入量，这不是更离谱吗？
四轴mpu6050姿态角卡尔曼滤波代码分析
AI Chen: "而且最大的错误在于这样写，Q乘以了一个dt，但是最后并不会怎么影响，因为Q也是初始给的一个值而已，但是这样写还是有问题的，还是按照推导来写比较好。" 可以参考一下这篇文章：https://blog.tkjelectronics.dk/2012/09/a-practical-approach-to-kalman-filter-and-how-to-implement-it/ Q还是要乘以△t的：This makes sense as the process noise will be larger as longer time it is since the last update of the state. For instance the gyro could have drifted. 我的经验是，有△t和无△t对PID调参影响很大。。。
最优控制LQR求解
进击的珂仔: 这个感觉更像是MPC下的无约束动态规划
最优控制LQR求解
yzqcwdxka: 您好请问第一个P（N）是怎么求出来的呢
最优控制LQR求解
yzqcwdxka: 您好，请问第一个P（N）是怎么求出来的呢

大家在看

最新文章

目录

评论 7

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。