【最优控制笔记】——2离散系统最优控制之不定终值

Piccab0o

已于 2023-11-27 16:04:48 修改

阅读量96

点赞数

分类专栏：最优控制课堂笔记文章标签：笔记

于 2023-11-15 15:38:51 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_52077466/article/details/134414106

版权

最优控制课堂笔记专栏收录该内容

11 篇文章 4 订阅

订阅专栏

离散系统最优控制

说明：

在前述对终端状态确定情况的最优控制问题的基础上，进一步对终端状态不确定情况进行具体地讨论。

2.4 终端状态不确定——闭环控制

（2.4-1）思路：

类似的分析思路，我们还是根据Hamilton函数由式(2.2-5~8)可以得到状态、协状态和控制量的最初表达式：

在这里插入图片描述

但，对于终端状态不确定情况的 $x_N$ ， $dx_N\neq0$ ，可以需要根据其边界条件：

在这里插入图片描述
得到：

在这里插入图片描述
又根据性能指标中的终端状态权重项 $\phi=\frac12x_{N}^{\mathrm{T}}S_{N}x_{N}$ 可得：

此处，不同于终端状态固定情况下状态和协状态解耦的形式，这里终端状态不固定时，状态和协状态耦合，很难求解。
但很容易看出，如果我们假设所有的 $\lambda_k$ 都满足式(2.2-49)的形式，即：

在这里插入图片描述
便使问题求解容易。因此，只需要找到 $\lambda_k$ 的一致表达形式即可。

（2.4-2）解决：

将式(2.2-50)代入状态 $x_{k+1}$ 的表达式(2.2-45)得：

在这里插入图片描述
将式(2.2-50)代入协状态 $\lambda_k$ 的表达式(2.2-46)得：

在这里插入图片描述
由于 $x_k$ 往往非零，故两边可同除 $x_k$ ，再利用matrix inversion lemma 可得：

在这里插入图片描述
这说明 $S_k$ 完全取决于系统的权重矩阵和 $s_{k+1}$ ，因此 $\lambda_{k}$ 的形式满足，假设成立，可以基于此继续求解最优控制问题。

（2.4-3）最优控制问题求解：

上式(2.2-53)称为Riccati equation，如果 $\forall k,|S_k|\neq0$ ，可以继续用matrix inversion lemma改写：

在这里插入图片描述
其代入式(2.2-51)可得状态轨迹 $x_k$ 的迭代关系式。

进一步，考虑控制量 $u_k$ 。由式(2.2-47)可得：

在这里插入图片描述
由于将 $S_{k+1}$ 和 $x_{k+1}$ 都带入数值求解太过于繁琐，因此，考虑将约束方程 $x_{k+1}=A_kx_k+B_ku_k$ 代入，可得：

在这里插入图片描述
此处，控制量可以利用Kalman gain改写成：

在这里插入图片描述
因此，为了找到最优控制量，只需要求解Riccati equation找到 $S_k$ ，算出Kalman Gain即可。

同时，很有趣的一点是，最优控制序列 $u_k$ 是状态 $x_k$ 的比例函数。

（2.4-4）总结：

对于终端状态不确定的LQ问题，求解步骤总结如下：
在这里插入图片描述
对于the final-state weighting matrix $S_k$ 的原始形式，可以采用Kalman Gain改写：

在这里插入图片描述
其等价于Joseph stabilized version of the Riccati equation：

在这里插入图片描述
其求解起来具有更优的数值求解性能。

（2.4-5）对该情况下性能指标的研究：

研究上述最优控制量作用下系统的性能指标：

在这里插入图片描述
利用下式改写 $J_i$ ：

再将 $x_{k+1}=A_kx_k+B_ku_k$ 代入，等价于：

在这里插入图片描述
根据Riccatt Equation(2.2-53)，其又可以写成：

在这里插入图片描述
可以整理成：

在这里插入图片描述
容易发现，当采用最优控制量 $u_k$ 控制时，性能指标为：

在这里插入图片描述
更一般地， $\forall k \in [i,N]$ ，都能算出 $[k, N]$ 区间段的性能指标 $J_k$ ：

在这里插入图片描述
由此，称 $S_k$ 为performance index kernel matrix。

（2.4-6）与前述内容的联系

说明：

为了直观地理解基于Riccati方程的控制律，回顾前述内容。

在静态优化部分例1.2-2，考虑二次型性能指标：

在这里插入图片描述
其线性约束设为：

在这里插入图片描述
写出Hamilton函数：

在这里插入图片描述
可以得出：

在这里插入图片描述
最优控制量：

通过最优控制量，可以得到最优状态和拉格朗日乘子：

在这里插入图片描述
利用the matrix inversion lemma，拉格朗日乘子可以改写成：

利用式(1.2-31)：

在这里插入图片描述
可以得出the constrained curvature matrix ：

在这里插入图片描述

回顾：

①由式(2.2-66)可得time-varying curvature matrix：

$\frac{ \partial ^2 J_i}{\partial u_k^2 }=B_k^TS_{k+1}B_k+R_k$

易知，时变情况下的系统与静态系统的曲率矩阵具有类似的形式。

②由式(2.2-51)经the matrix inversion lemma 改写可得状态表达式：

在这里插入图片描述
其也与静态系统的最优状态(13)具有类似的形式。

③在终端固定条件的讨论零输入情况下（ $B_k=0$ ），二次的Riccati Eqution也降阶成了线性的Lyapunov equation：

在这里插入图片描述

（2.4-7）示例：

$Page_{158}-Page_{169}$ ，例子中的 $S_k$ 差分方程难以求解，分别讨论了不同情况下的数值求解方法。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【最优控制笔记】——2离散系统最优控制之不定终值

对于终端状态不确定的LQ问题，求解步骤总结如下：对于the final-state weighting matrixSkS_kSk的原始形式，可以采用Kalman Gain改写：其等价于Joseph stabilized version of the Riccati equation：其求解起来具有更优的数值求解性能。
复制链接

扫一扫

专栏目录

Piccab0o CSDN认证博客专家 CSDN认证企业博客

码龄4年

20: 原创

2万+: 周排名

8万+: 总排名

1万+: 访问

: 等级

478: 积分

918: 粉丝

279: 获赞

14: 评论

260: 收藏

私信

关注

热门文章

分类专栏

现代控制理论课堂笔记 7篇
最优控制课堂笔记 11篇

最新评论

【最优控制笔记】——4自适应动态规划1
qq_44189536: 你好，请问在哪里听魏老师的课啊？
【机器人控制】——自适应抗扰控制（ADRC）
weixin_44425356: 大佬咨询下，ADRC是不是相当于PID里面没有I项，这种累计误差靠什么消除呢
【现代控制理论笔记】——第二章：能控性分析
CSDN-Ada助手: 恭喜您撰写了第16篇博客！标题中的“现代控制理论笔记”让我对您的博客产生了浓厚的兴趣。阅读您的第二章1后，我对您的深入分析和详细阐述感到赞赏。您对现代控制理论的理解和表达能力令人印象深刻。在下一步的创作中，或许您可以考虑加入一些实例或案例，以丰富读者的阅读体验。这样，读者可以更好地将理论与实际应用联系起来，并从中获得更多的启发。谦虚地说，这只是一个建议，希望对您的创作有所帮助。期待您未来更多精彩的博客！
【现代控制理论笔记】——第一章：线性定常系统的表示方法及运动分析
CSDN-Ada助手: 恭喜您写完第15篇博客！标题看起来很有深度，我相信您对现代控制理论有着扎实的了解。不断分享知识是非常值得赞赏的，您的努力让读者受益匪浅。在下一步的创作中，我建议您可以探索一些具体的案例分析，将理论与实践相结合，更加生动地阐述控制理论的应用。期待您更多精彩的博客！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。