基于深度强化学习的多智能体编队协同控制

最新推荐文章于 2024-07-22 21:21:48 发布

renhongxia1

最新推荐文章于 2024-07-22 21:21:48 发布

阅读量268

点赞数 1

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/renhongxia1/article/details/138062449

版权

源自：《指挥信息系统与技术》

作者：文永明，李博研，张宁宁，李小建，熊楚依，刘洁玺

“人工智能技术与咨询” 发布

摘要

采用深度强化学习算法解决了多智能体编队协同控制问题。基于多智能体深度确定性策略梯度算法（MADDPG）构建分布式编队控制架构，并结合集中式训练-分布式执行框架进行求解。针对多智能体环境不稳定问题，依据单个智能体的局部信息构建对应奖励函数。针对大规模编队协同控制，实现了多个多智能体环境下的算法训练与评估。试验结果表明，应用该算法的多智能体能够完成协同任务，且所有智能体都可得到合理的协同控制策略。

声明:公众号转载的文章及图片出于非商业性的教育和科研目的供大家参考和探讨，并不意味着支持其观点或证实其内容的真实性。版权归原作者所有，如转载稿涉及版权等问题，请立即联系我们删除。

“人工智能技术与咨询” 发布

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
基于深度强化学习的多智能体编队协同控制

基于多智能体深度确定性策略梯度算法（MADDPG）构建分布式编队控制架构，并结合集中式训练-分布式执行框架进行求解。针对多智能体环境不稳定问题，依据单个智能体的局部信息构建对应奖励函数。针对大规模编队协同控制，实现了多个多智能体环境下的算法训练与评估。试验结果表明，应用该算法的多智能体能够完成协同任务，且所有智能体都可得到合理的协同控制策略。公众号转载的文章及图片出于非商业性的教育和科研目的供大家参考和探讨，并不意味着支持其观点或证实其内容的真实性。作者：文永明，李博研，张宁宁，李小建，熊楚依，刘洁玺。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。