LQR 控制算法应用分析

最新推荐文章于 2024-07-05 17:39:44 发布

jucat

最新推荐文章于 2024-07-05 17:39:44 发布

阅读量1k

点赞数 21

分类专栏：算法文章标签：机器学习算法人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jucat/article/details/139887953

版权

算法专栏收录该内容

20 篇文章 2 订阅

订阅专栏

参考

Optimization Based Control 从基础到复杂地介绍最优控制理论

麻省理工大学机器人算法第八章 LQR 大概说了 lqr 的推导过程，主页有更多算法介绍

wiki LQR 控制器 LQR 多种公式说明

Formulas for discrete time LQR, LQG, LEQG and minimax LQG optimal control problems 离散 LQR 问题论文

黎卡提方程解释

公式推导部分理解有限，这里不折腾了，直接进入应用环节。

LQR 二次线性调节器 Linear Quadratic Regulators

wiki 中将 LQR 控制器根据应用分类出四种公式：

Finite-horizon, continuous-time，有限视野，连续时域
Infinite-horizon, continuous-time，无限视野，连续时域
Finite-horizon, discrete-time，有限视野，离散时域
Infinite-horizon, discrete-time，无限视野，离散时域

在这里，有限视野的公式中会考虑控制的终点状态，而无限视野的公式不考虑控制的终点状态，可以说在无限视野中，LQR 调节是永不停息的。

在实际应用控制中，都是以固定的频率控制系统，所以这里只考虑离散时域的控制公式。另外，在无限视野中，随着控制调节次数增加（时间流逝），系统会逐渐稳定。系统稳定后虽然不再需要控制调节，但是算法仍会继续工作。下面以无限视野，离散时域的公式作说明。

LQR 用线性方程描述系统，用代价函数表示控制的优劣，其中有些代价项的计算可能得到负值，所以会对代价项进行平方操作以保证代价值为正，且存在最小值。方程描述如下：

$x_{k+1} = Ax_{k}+Bu_{k} \quad (1)$

$J=\sum^{\infty}_{k=0}{(x^T_kQx_k+u^T_kRu_k+2x^T_kNu_k)} \quad (2)$

$u_{k+1}=-Kx_k \quad (3)$

$K=(R+B^TPB)^{-1}(B^TPA+N^T) \quad (4)$

公式 (1) 中， $x_{k+1}$ 是下个时刻的系统状态，一般来说系统状态描述为误差值。例如猎豹捕食追赶羚羊，猎豹和羚羊之间的位置误差，也就是欧氏距离作为系统状态，该系统运行到稳定就是猎豹追赶到羚羊，它们间位置误差为 0。

公式 (2) 是代价评估， $x^T_kQx_k$ 表示状态代价, $u^T_kRu_k$ 表示控制代价， $2x^T_kNu_k$ 表示？？？代价。Q 是半正定加权矩阵，R 是正定加权矩阵，N 是？？？，需要调参设置。

公式 (3) 是使得系统代价 J 最小的控制序列定义。其中控制增益 K 由公式 (4) 给出。

P 根据黎卡提方程求解：

$P_{k-1}=A^TP_{k}A-(A^TP_{k}B+N)(R+B^TP_{k}B)^{-1}(B^TP_{k}A+N^T)+Q \quad (5)$

注意黎卡提方程求解是一个逆向求解，通常令终点 $P_t=Q$ ，然后迭代 n 次后得到 $P_0$ 值。

翻了一些资料没有找到代价公式中 $2x^T_kNu_k$ 的解释，该公式来自论文《Formulas for discrete time LQR, LQG, LEQG and minimax LQG optimal control problems》，但论文也只是直接给出公式：

fig.1 离散 LQR 公式

从公式上可以理解是“控制转换到状态的代价？”。对比其他文章资料，此时将 N 设置为零矩阵即可。

高度跟踪

先测试简单的一维高度跟踪例子。

一个飘浮器 P 每个时刻会在 [-0.25，0.25] 米范围内飘动，一个跟踪器 G 通过 $\frac{1}{2}*u*dt^2$ 的控制跟踪飘浮器。系统状态描述为跟踪器与飘浮器的高度差：

$h_{G}-h_{P}+\frac{1}{2}*u*dt^t=0 \quad (6)$

其中 $A=h_G-h_P$ ， $B=\frac{1}{2}dt^2$ 。

仿真步骤：

随机初始化飘浮器 P 和跟踪器 G 的高度；
while (1)：
更新飘浮器 P 高度；
逆向迭代求解矩阵 P，然后计算增益 K，最后计算得到控制 u；
更新跟踪器 G 高度；
计算控制消耗；

测试，绿线表示飘浮器 P 高度，红线表示跟踪器 G 高度。

当权重矩阵 Q=1，R=1 时候，跟踪效果如下：

高度跟踪Q1R1

当权重矩阵 Q=60，R=1 时候，跟踪效果如下：

高度跟踪Q60R1

当权重矩阵 Q=130，R=1 时候，跟踪效果如下：

高度跟踪Q130R1

当权重矩阵 Q=130，R=30 时候，跟踪效果如下：

高度跟踪Q130R30

从上面测试可以看出 Q 矩阵越大，说明系统状态越重要，LQR 控制会尽量输出大控制来收敛系统误差。而 R 矩阵越大，说明控制幅度不能太大，LQR 控制会尽量降低控制幅度。

尽管公式 (3) 计算控制增益 K，但是在该公式中仅仅包含系统代价中状态代价和控制代价的权重，而不关心具体的代价形式，最终的系统稳态调节效果依赖权重矩阵 Q 和 R 的调参。

关注

21
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
LQR 控制算法应用分析

LQR 控制应用测试
复制链接

扫一扫

专栏目录

jucat CSDN认证博客专家 CSDN认证企业博客

码龄7年

35: 原创

22万+: 周排名

3万+: 总排名

2万+: 访问

: 等级

823: 积分

303: 粉丝

459: 获赞

17: 评论

471: 收藏

私信

关注

热门文章

分类专栏

工具 4篇
调试记录 8篇
算法 20篇
ROS 1篇

最新评论

ros noetic mpc local planner 编译问题
普瑞特: 大神，謝謝謝！
ipa 功能包调试，分区算法，覆盖算法测试
jucat: 可以用 catkin_create_pkg，这个包只是存放地图和地图yaml，已经测试的启动的 launch 而已。
ipa 功能包调试，分区算法，覆盖算法测试
CCBC6: 你好，我想咨询一下这个“ipa_env 包目录”应该如何创建呢？是直接`catkin_create_pkg ipa_env`，就可以吗？具体map.yaml和test0.png该如何获取呢？是自己写一个吗？谢谢！
ubuntu20 cmakelist 编译找不到 protobuf 问题解决
zsk23: 把旧的库函数全部删除就行了
ubuntu20 cmakelist 编译找不到 protobuf 问题解决
zsk23: 我也遇到一样问题了，但是按up的方法还报错是为沙，说是很多函数未定以

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。