![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
多智能体博弈
文章平均质量分 95
睡觉狂魔er
2X岁,是学生
展开
-
多智能体博弈论文学习(4)Learning Vision-based Pursuit-Evasion Robot Policies
直接使用强化学习训练智能体解决部分可观测问题是不成功的,因此论文使用特权学习的方法,将evader的未来轨迹也作为特权信息,首先在仿真环境中训练完全可观测策略(fully-observable policy),并且训练一个用于预测evader未来轨迹的网络,然后使用这一组策略来监督训练机器人上的部分可观测策略和意图预测预测网络。通过这种方法,论文得到了难以处理的分布式部分可观测马尔可夫决策过程的最优策略的近似。原创 2024-06-03 11:30:00 · 1058 阅读 · 0 评论 -
多智能体博弈论文学习(3)Task Assignment for Multiplayer Reach-Avoid Games via Analytical Barriers
论文原文:Task Assignment for Multiplayer Reach-Avoid Games in Convex Domains via Analytical Barriers,解析计算多pursuer多evader的reach avoid博弈的barrier,并且提出了一种通过解析barrier先验信息的0-1规划求解pursuers的任务分配问题原创 2024-03-27 13:43:02 · 652 阅读 · 1 评论 -
多智能体博弈论文学习(2)Reach-Avoid Games With Two Defenders and One Attacker: An Analytical Approach
本篇论文考虑在矩形区域上进行的reach-avoid博弈,其中有两名防守者和一名攻击者。攻击者的目标是到达区域边界的特定边缘(ATL),而防御者则努力通过捕获攻击者来阻止这种情况。论文提出了一种Barrier的解析解法,进一步得到了智能体在各自胜利区域以及对方胜利区域内的最优策略,均给出了严谨的证明。原创 2023-08-14 10:33:38 · 423 阅读 · 0 评论 -
多智能体博弈论文学习(1)Intercepting Rogue Robots
论文:Intercepting Rogue Robots: An Algorithm for Capturing Multiple Evaders With Multiple Pursuers的阅读笔记以及复现记录。原创 2023-08-03 21:06:55 · 679 阅读 · 2 评论