离散LQR：原理，求解与拓展

最新推荐文章于 2024-05-29 16:04:38 发布

dymodi

最新推荐文章于 2024-05-29 16:04:38 发布

阅读量3w

点赞数 17

分类专栏：控制理论文章标签： LQR-控制

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dymodi/article/details/46303633

版权

该文档用以总结离散LQR的基本原理，反馈控制率的求解和一些拓展（时变系统，跟踪命题等）。主要参考的是Stanford的课程EE363: Linear Dynamical Systems的部分课件。

目录

1 有限时域离散LQR的基本原理

这里我们首先考虑一个离散的线性系统：

x t + 1 = A x t + B u t, x 0 = x i n i t

$x_{t+1}=Ax_{t}+Bu_t, x_0 = x^{init}$
LQR的目标就在于，找到一组控制序列

u0,u1,... $u_0, u_1, ...$ 能够使得：

$x_0, x_1, ...$ 尽量小，即将状态调节到零点；
$u_0, u_1, ...$ 尽量小，即控制器付出较小的努力；

然而，这两个目标往往是冲突的，因为较大的控制作用 $u$ 能更快地将状态调节到零点。因此LQR就是根据需要设计出一组控制率来实现上面两个目标的权衡。

为此，我们定义如下的二次代价函数（quadratic cost function）：

J (U) = \sum τ = 0 N - 1 (x T τ Q x τ + u T τ R u τ) + x T N Q f x N

$J(U)= \sum_{\tau=0}^{N-1} {(x_{\tau}^TQx_{\tau}+ u_{\tau}^TRu_{\tau})} +x_N^{T}Q_fx_N$ 这里

U=(u0,u1,...,uN−1) $U=(u_0, u_1, ...,u_{N-1})$ ，且

Q = Q T \geq 0, Q f = Q T f \geq 0, R = R T > 0

$Q=Q^T \ge 0, \quad Q_f = Q_f^T\ge 0, \quad R=R^T \gt0$ 分别被称为 state cost, final state cost, input cost 矩阵。

代价函数中的三项分别用来衡量状态偏差，输入偏差以及最终状态偏差。 $Q$ 和 $R$ 用来确定状态和输入的相对权重。
因此，LQR的问题就是，找到一组序列： $u_0^{\text{lqr}}, ..., u_{N-1}^{\text{lqr}}$ 来最小化代价函数 $J(U)$ 。

通常 $Q$ 和 $R$ 的形式为：

R = ρ I, Q = Q f = C T C

$R=\rho I, \quad Q=Q_f=C^TC$ 这里

C∈Rp×n,ρ∈R,ρ>0 $C \in \mathbf R^{p\times n}, \quad \rho \in \mathbf R, \quad \rho \gt 0$ 。

于是，代价函数就可以变形为：

J (U) = \sum τ = 0 N ∥ y τ ∥ 2 + ρ \sum τ = 0 N - 1 ∥ u τ ∥ 2

$J(U)= \sum_{\tau=0}^N {\lVert y_{\tau} \rVert ^2}+ \rho \sum_{\tau=0}^{N-1} {\lVert u_{\tau} \rVert ^2}$ 这里

y=Cx $y=Cx$ ，

ρ

最低0.47元/天解锁文章

关注

17
点赞
踩
95

收藏

觉得还不错? 一键收藏
9
评论
离散LQR：原理，求解与拓展

该文档用以总结离散LQR的基本原理，反馈控制率的求解和一些拓展（时变系统，跟踪命题等）。主要参考的是Stanford的课程EE363: Linear Dynamical Systems的部分课件。目录目录有限时域离散LQR的基本原理基于动态规划Dynamic Programming的求解一些拓展1 有限时域离散LQR的基本原理这里我们首先考虑一个离散的线性系统： xt+1=Axt+But,
复制链接

扫一扫

专栏目录

dymodi CSDN认证博客专家 CSDN认证企业博客

码龄13年

21: 原创

17万+: 周排名

40万+: 总排名

36万+: 访问

: 等级

2171: 积分

326: 粉丝

365: 获赞

97: 评论

1305: 收藏

私信

关注

热门文章

分类专栏

最新评论

有效集法介绍（Active Set Method）
Mr_Dwj: 严谨又漂亮，不愧是当今优秀的 scholar
内点法介绍（Interior Point Method）
Zhihao_Ke: 您好，博主，想请教下是不是用主对偶方法的内点法不能求解二次规划问题哇。
内点法介绍（Interior Point Method）
Led_Mes_Kb: 按理说应该不会出现这种情况吧，你是不是初始的惩罚函数写错了
内点法介绍（Interior Point Method）
大皮·: github还真听过，但这和我的问题有什么联系吗？
内点法介绍（Interior Point Method）
小珂的无人驾驶: 你好up,想问一下对于障碍函数法求解的时候，有时候会出现log里面的表达式为负，最后求解出的不满足不等式约束的解，这个问题该如何解决呢？我目前是判断是否符合约束，不符合就重新生成初始点迭代，想知道有没有更好的办法，还是这个障碍函数法的缺陷不好解决

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 9

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。