泛函(性能指标)
定义 ,泛函可简单理解为“函数的函数”。
- y是x的函数,记为 y(x)。x是自变量,y是因变量。
- 因变量J为函数y(x)的泛函数,简称泛函。记为J=J [y(x)] 或记为J。
它经常以定积分的形式出现,一旦函数的表达式确定,则J的值是确定的。 - 泛函的变量y(x)的变分: 泛函J [y(x)] 的变量y(x)的**增量 **
- 泛函的连续性: 若对于变量y(x)的微小改变,存在与之对应的泛函J [y(x)]的微小改变,则称泛函J [y(x)]为连续的。
- 一阶接近度:
如果不仅y(x)-y0(x)很小,而且|y(x)-y0(x)|也很小;
k阶接近度:
|y(k)(x)-y0(k)(x)| - 线性泛函
- 泛函的变分(或微分)是泛函增量的线性主部L
R为高阶无穷小量 - 泛函变分定理
强极值/弱极值:
如果y(x)与y0(x)具有零阶接近度,则泛函达到的极值为强极值;
如果y(x)与y0(x)具有**一阶(或一阶以上)**接近度,则泛函的极值为弱极值
微分、差分与变分
1)微分:是当自变量x变化了一点点(dx)而导致了函数(y=f(x))变化dy。把微分dy视为dx的线性函数,那么导数就是这个线性函数的系数。
2)差分:离散化的微分, 当y变化量很微小时,就近似看成dy。
3)变分:泛函的变分,泛函把一个函数映射成一个数。打个比方,从A点到B点有无数条路径,每一条路径都是一个函数,这无数条路径,每一条函数(路径)的长度都是一个数,那你从这无数个路径当中选一个路径最短或者最长的,这就是求泛函的极值问题。有一种老的叫法,函数空间的自变量我们称为宗量(自变函数),当宗量变化了一点点而导致了泛函值变化了多少 即变分。变分,就是微分在函数空间的拓展。
求解泛函变分的方法主要有古典变分法、贝尔曼的动态规划方法和庞特里亚金的极大值原理
古典变分法
研究对泛函求极值的一种数学方法,只能用在控制变量的取值范围不受限的情况
动态规划(贝尔曼)
可用于控制变量受限的情况,是一种适合于在计算机上进行计算的比较有效的方法
利用动态规划可以解决的问题需要满足两个条件:(1)整个优化问题可以分解为多个子优化问题,子优化问题的解可以被存储和重复利用。
利用贝尔曼最优性原理得到贝尔曼最优化方程:动态规划的核心是找到最优值函数:
https://zhuanlan.zhihu.com/p/25580624
庞特里亚金极大值原理PMP
在满足一定约束的情况下,寻求最优控制策略,使得性能指标取极大值或极小值
对一个受控的动力学系统,从一类允许的控制方案中寻找一个最优的控制方案,使得系统的运动从由某个初始状态转移到目标状态的同时,其性能指标值为最优。
分析力学中哈密尔顿方法的推广,其突出的优点是可以用于控制变量取值受限的情况
- 由极大值原理算出的最优控制是时间t的函数u(t),称为开环控制。不能消除或者抑制由于参数的变动和环境的变化对系统造成的扰动,也就是鲁棒性很差
- 另一种形式是表示为状态变量x(t) 的函数u(x),实际上一种状态反馈,称为闭环控制,其优点是能有效抑制扰动