11.35 线性系统最优跟踪控制
由于在现实中具有很广泛的应用价值,最优跟踪问题一直是控制界学者研究热点之一[14-16] 。最优跟踪控制的任务就是设计一个最优跟踪控制器,使得系统的输出以一种最优的方式跟踪上一个参考轨迹[1] 。根据文献 [1] 可知,对于连续时间线性系统而言,最优跟踪控制器由一个线性反馈项和一个前馈项构成。线性反馈项是与一个代数 Riccati 方程相关,而线性前馈项依赖于由参考轨迹信号驱动的伴随闭环系统的输出。这样,求解最优跟踪问题显得过于冗杂。这是因为不仅需要求解一个代数 Riccati方程,还要求解一个非因果辅助微分方程。此外,因为代数 Riccati 方程和非因果辅助方程都包含系统的动态知识,求解最优跟踪问题要求系统必须是已知,否则就无法得到系统的最优跟踪控制器。由于代数 Riccati 方程只能通过离线迭代的方式求解,这样导致无法利用系统在线实时数据来得到系统的最优跟踪控制器。因而,设计动态知识未知连续时间线性系统的在线最优跟踪控制仍然是个挑战。
基于此考虑,我们提出一个基于 ADP 最优跟踪控制方案,有效解决了动态知识未知连续时间线性系统的最优跟踪问题。首先将原系统和参考轨迹动态系统构建成一个新增广系统,从而把原系统的最优跟踪问题转化增广系统的最优调节控制问题。在具有相同的性能指标函数的情况下,给出了增广系统的代数 Riccati 方程,进而根据增广代数Riccati 方程能够以一种因果关系同时,得到原系统最优跟踪控制器的反馈项和前馈项,并证明了增广系统的最优控制解等价于原系统的最优跟踪控制问题的标准解。然后,基于 ADP 技术,给出了一种新的在线数据驱动 ADP 算法,以实现在线求得动态知识未知连续时间线性系统的最优跟踪控制器。