最优控制——变分法

本文深入探讨了最优控制问题的基础,包括状态方程、性能指标和变分法的应用。介绍了直接变分法、拉格朗日乘子法及KKT条件,并阐述了欧拉-拉格朗日方程在处理最简变分问题中的作用。此外,还讨论了无确定模型的最优控制方法如强化学习和动态规划。
摘要由CSDN通过智能技术生成

 

第一章 最优控制基础

1、一般的最优化问题要最小化的性能指标定义在数域上,而变分问题的性能指标(目标泛函)的定义域是函数的集合。

2、 泛函:从任意定义域到实数域或复数域的映射。泛函的定义域是函数集,值域是数集,也就是说,泛函是从函数空间到数域的一个映射

3、最优控制问题的四个基本元素:状态方程、容许控制、目标集、性能指标

其中状态方程(关于状态变量和控制变量的常微分方程)

 

是最优控制问题与经典变分问题的重要区别之一

4、经典变分问题需要连续的控制变量--->之后的极小值原理处理不连续控制变量、状态变量或者控制变量有约束的情况--->更复杂的非线性状态方程、控制变量不可微等      动态规划方法

5、无确定模型的最优控制方法:强化学习与自适应动态规划、模型预测控制、微分博弈、平行控制

第二章 最优控制方法

1、直接变分法 实质:以函数为输入,以实数为输出

在局部范围内对最优解加以”扰动“,再考察性能指标是否发生变化。利用微积分取极限的思想。

(链式法则,先对x求,再对x'求,以及分步积分巴拉巴拉复习一下

2、拉

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值