Self-Triggered Approximate Optimal Neuro-Control for Nonlinear Systems Through ADP

Self-Triggered Approximate Optimal Neuro-Control for Nonlinear Systems Through Adaptive Dynamic Programming,2024, Bo Zhao , Senior Member, IEEE, Shunchao Zhang , and Derong Liu , Fellow, IEEE

基于自触发和ADP解决非线性系统的近似最优神经控制问题。根据贝尔曼最优性原理,构建一个嵌入更新权重向量的评价网络,近似非线性系统的代价函数。间接求解HJB方程获得近似最优控制输入。为减少通信资源和计算负担、能力消耗,设计自触发条件,以预测最优控制策略更新。李雅普诺夫直接法分析非线性系统稳定性,保证UUB。提出自触发的近似最优神经控制使得系统稳定

时间触发和事件触发,只要吸引状态偏离超过一定阈值(该阈值由事件触发条件决定的),响应使得传感器采样和控制。事件触发基于当前的测量持续监测,事件触发条件决定是否在每次采样时将新的控制信号传给执行器,而自触发中的下一个触发事件是在前一个触发时间瞬间确定的,即传感器不再需要硬件设备连续监测系统状态,嵌入式设备可关闭通信直到下一个传输时间瞬间。

基于自触发的新触发条件,用于预测下一个触发瞬间。临界神经网络权值误差动力学保证渐近稳定,而不是最终一致有界(UUB)。所提出的控制方案权衡资源消耗和系统的性能指标。

Assumption1给出f(x)的Lipschitz 连续。Assumption2给出控制输入矩阵的有界性。Definition1给出控制策略的可容许性。
Theorem1给出nested updating policies确保评价网络权值误差动力学渐进稳定。
在这里插入图片描述

Assumption3给出控制输入Lipschitz 连续,最优控制输入和控制输入的范数
Assumption4给出权值激活函数误差的有界
Theorem2给出在以上假设和控制策略下,如果满足
在这里插入图片描述
非线性系统的UUB稳定性可以保证。证明由候选李雅普诺夫函数
Definition2给出Zeno行为定义
Theorem3给出自触发时间序列
在这里插入图片描述
Algorithm1基于ADP的自触发近似最优控制(基于PI)
在这里插入图片描述
自触发满足最低限度的计算要求
非周期更新控制策略,减少计算和通信资源;通过自触发机制预测控制策略的更新时间的瞬间,不需要在事件触发控制结构中监视完整系统状态

  • 5
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值