第一章 最优控制基础
1、一般的最优化问题要最小化的性能指标定义在数域上,而变分问题的性能指标(目标泛函)的定义域是函数的集合。
2、 泛函:从任意定义域到实数域或复数域的映射。泛函的定义域是函数集,值域是数集,也就是说,泛函是从函数空间到数域的一个映射
3、最优控制问题的四个基本元素:状态方程、容许控制、目标集、性能指标
其中状态方程(关于状态变量和控制变量的常微分方程)
是最优控制问题与经典变分问题的重要区别之一
4、经典变分问题需要连续的控制变量--->之后的极小值原理处理不连续控制变量、状态变量或者控制变量有约束的情况--->更复杂的非线性状态方程、控制变量不可微等 动态规划方法
5、无确定模型的最优控制方法:强化学习与自适应动态规划、模型预测控制、微分博弈、平行控制
第二章 最优控制方法
1、直接变分法 实质:以函数为输入,以实数为输出
在局部范围内对最优解加以”扰动“,再考察性能指标是否发生变化。利用微积分取极限的思想。
(链式法则,先对x求,再对x'求,以及分步积分巴拉巴拉复习一下)
2、拉