本文是LLM系列文章,针对《SRLM: Human-in-Loop Interactive Social Robot Navigation with Large Language Model and Deep Reinforcement Learning》的翻译。
摘要
交互式社交机器人助手必须在复杂和拥挤的空间中提供服务,同时根据实时人类语言命令或反馈调整其行为。在本文中,我们提出了一种新的混合方法,称为社交机器人规划器(SRLM),它集成了大型语言模型(LLM)和深度强化学习(DRL),以在充满人的公共空间中导航并提供多种社会服务。SRLM实时从人在环命令中推断全局规划,并将社会信息编码到基于LLM的大型导航模型(LNM)中,用于低级运动执行。此外,设计了一个基于DRL的规划器来保持基准性能,该规划器通过大反馈模型(LFM)与LNM混合,以解决当前文本和LLM驱动的LNM的不稳定性。最后,SRLM在大量实验中表现出了卓越的性能。有关这项工作的更多详细信息,请访问:https://sites.google.com/view/navi-srlm。