点击蓝字
关注我们
AI TIME欢迎每一位AI爱好者的加入!
李娇阳:南加州大学计算机系博士四年级学生,导师Sven Koenig, 本科毕业于清华大学自动化系。目前主要的研究方向为人工智能,多智能体规划,组合优化,搜索算法等。以第一作者在AAAI,IJCAI,ICAPS,AAMAS等顶级会议上发表论文十余篇。曽担任Artificial Intelligence, IEEE Robotics and Automation Letters等期刊审稿人,AAAI,IJCAI,ICAPS等会议评审委员会委员,IJCAI会议评审委员会资深委员, 并组织举办了IJCAI-2020多智能体路径规划研讨会。曾获得2019年南加州大学技术商业化奖,2020年高通奖学金,2020年ICAPS最佳学生论文, 以及2020年NeurIPS Flatland挑战赛(Multi-Agent Reinforcement Learning on Trains)第一名。本次报告的其中一项工作(论文1)在Amazon Robotics实习期间完成。
一、背景
多智能体路径规划,英文叫Multi-Agent Path Finding,简称为MAPF。它本质上是一个数学问题,通过给每个机器人规划一条路径,保证这些路径不相撞,并最小化总的运行时间。
它有很多实际应用,其中一个是仓储系统。近年来机器人仓储系统吸引了很多人的注意,出现了各种各样的仓储系统,比较典型的有亚马逊的Kiva system,以及sorting center,和一些比较新的系统。这些系统本质上是给成百上千个机器人同时做规划路径,然后保证它们既不相撞,同时又能很快的到达目的地。
传统方法采用single-agent方法,通过给每一个机器人规划它们的最短路,或者最小时间路径。如果两个机器人可能相撞,就用一些简单的交通规则处理,比如说其中一个机器人减速或换一条路。但这种方法在简单的系统中工作较好,一旦机器人数量或密度增大,就会出现拥堵,导致整个系统效率变低。而MAPF solver把所有机器人的路径一起规划,会考虑到各种碰撞的可能性。在同等情况下,MAPF solver可以很好的去调度所有的机器人的路径,使得它们可以顺畅的到达目的地。
这张图展示了不同机器人个数下,系统吞吐量的变化。可以看到在一开始的时候,两种方法很接近,基本上保持线性增加,但是当机器人个数到一定值的时候,Single-agent会出现拥堵,导致系统的吞吐量增长率开始下降,经过巅峰之后,增长率开始下降,这是因为系统中出现了严重的交通拥堵,导致系统开始瘫痪。而对于MAPF solver来说,在测试的1000个机器人之内,吞吐量几乎保持线性增长。
除了仓储系统,其还可以应用于交通系统,比如火车调度的例子。MAPF solution可以在几分钟之内调度3000多个火车到他们的目的地。
除火车调度以外,一个类似的应用是飞机调度,这是我之前和NASA合作的项目,我们如何用MAPF的方法来控制飞机的起飞与降落。这个问题的难点在于,飞机的控制包含有很多不确定性因素,例如天气干扰,人为因素干扰,所以我们要把MAPF模型和随机模型结合起来,考虑到各种因素干扰,控制整体的调度与运行。
MAPF还可以被用到很多机器人系统中,比如说自动叉车,自动停车系统,无人车、无人机以及一些水下机器人。对这些系统一方面要避免碰撞,另一方面要去考虑各种机器人不同的动力学约束,