基于群体熵的机器人群体智能汇聚度量

本文提出了一种基于群体熵的多智能体soft Q learning算法,用于衡量群体智能水平并促进群体智能的增强。通过参数共享和最大熵强化学习,算法在探索型任务中提高了群体策略的学习效率。同时,定义群体熵作为度量工具,分析了群智汇聚过程,展示了在群体任务中熵变化如何反映智能体间的交互效果。实验结果显示,与独立Q学习相比,提出的算法在探索效率和收敛速度上有显著优势。
摘要由CSDN通过智能技术生成

【摘 要】群体行为往往能产生远超个体行为的价值和复杂度。为了在个体智能的基础上更有效地衍生出群体智能,需要基于群体熵来科学地衡量群体智能水平,并以群体熵为引导目标,推动群体智能的增强和演进。针对这个重要的科学问题,以无人小车群体为研究对象,提出基于参数共享和群体策略熵的多智能体soft Q learning算法,通过共享智能体的观测信息,并结合最大熵强化学习方法,实现探索型任务中群体策略的持续学习更新。同时,通过将群体熵定义为度量工具,刻画群体学习中熵变化模式,实现对群智汇聚过程的定量分析。

【关键词】  群体熵 ; 群体智能 ; 深度强化学习

0 引言

个体间的交互等行为让群体现象变得更加复杂,个体合作让群体发展出高于个体智能的更复杂的智能模式。人工智能的发展推动了人类社会的快速发展,在单体智能的基础上,群体智能模式应运而生。例如无人机(车)集群协同对抗、群体软件开发等复杂群体行为,都可以被视为群体智能的体现。不同时空节点上的个体通过通信、观测等方式,以竞争、合作等自主协同模式共同完成复杂任务,涌现出超越个体智能的群体智能。

对群体智能机理的研究主要从生物仿生和控制算法研究展开,一方面对生物体的群体行为进行仿生研究,主要包括模拟鸟群行为的Boids模型、自驱动粒子模型(Vicsek模型)、进化算法、

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

米朵儿技术屋

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值