论文标题
MP5: A Multi-modal Open-ended Embodied System in Minecraft via Active Perception
论文链接:
MP5: A Multi-modal Open-ended Embodied System in Minecraft via Active Perception论文下载
论文作者
Yiran Qin, Enshen Zhou, Qichang Liu, Zhenfei Yin, Lu Sheng, Ruimao Zhang, Yu Qiao, Jing Shao
内容简介
该论文介绍了MP5,这是一个在Minecraft环境中通过主动感知来实现的多模态、开放式的具身系统。MP5旨在解决长期、开放世界的具身任务,这些任务对人类来说具有挑战性,需要逻辑感知分解和情境感知执行。
MP5通过结合多个功能模块,能够分解可行的子目标、设计复杂的情境感知计划,并执行具身动作控制。实验结果表明,MP5在困难的过程依赖任务上取得了22%的成功率,在重度依赖情境的任务上取得了91%的成功率,并且能够处理许多完全新颖的开放式任务。