未知异构多智能体系统无模型自适应动态规划同步控制

【摘 要】多智能体协同在众多领域逐渐得到应用,但是还有很多仍未解决的问题。为此,研究了基于无模型自适应动态规划(MFADP)的未知异构多智能体系统同步控制问题,其中领航者智能体和追随者智能体动态模型均是未知的。首先为每一个追随者智能体设计观测器来估计领航者智能体的信息,包括领航者智能体状态以及领航者智能体系统动态矩阵。然后利用追随者智能体动态模型信息和观测器动态模型信息构建增广系统,运用贝尔曼最优性原理求得最优控制器以及对应的代数黎卡提方程。在追随者智能体系统动态模型信息未知的情况下,引出了MFADP算法。最后使用双质量-弹簧系统来验证所提算法的有效性。

【关键词】多智能体系统 ; 代数黎卡提方程 ; 基于无模型自适应动态规划

1.引言

随着科学技术的飞速发展及生产规模的不断扩大,社会上存在很多大型、复杂的现实问题,而解决这类问题已超出了单个智能体的能力。随着通信技术、计算机技术、机器人技术、传感器以及执行器的小型化发展,多个个体协同完成任务成为可能,并且逐渐在众多领域得到应用。多智能体系统(multi-agent system,MAS)同步控制吸引了很多学者的注意,已经被成功地应用于各种学科。根据智能体的动态模型和维度,MAS被分为同构MAS和异构MAS。根据领航者智能体(以下简称领航者)的数量,MAS同步控制可以分为无领航者问题、领航者-追随者问题以及包含问题。然而,在大多数实际应用下,智能体的动态模型和维度可能是不相同的,例如某些协作任务中参与的智能体可能包括地面无人机、水下无人机和空中无人机。因此本文研究了异构MAS领航者-追随者问题。在MAS通信网络中,并不是所有的追随者智能体(以下简称追随者)都能够获取领航者

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

宋罗世家技术屋

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值