【日记导读】谷歌机器人提出的Generative Expressive Motion(GenEM)方法,为了使机器人能够模仿人类的这种非言语交流能力。通过大语言模型(LLMs),GenEM能够理解和生成基于社会规范的机器人行为代码。例如,当一个人走过时,机器人可能会通过点头或改变灯光颜色来表示认可和友好。本篇工作获得人机交互顶会HRI2024最佳论文。
本篇工作探索如何让机器人通过肢体语言和行为来更自然地与人类进行交流。在人类的日常生活中,非言语交流(如肢体动作、面部表情、眼神交流等)扮演着至关重要的角色。这些非言语信号有助于传达情感、态度、反应和社会规范,使得交流更加丰富和有效。
文章的主要内容是提出了一种名为Generative Expressive Motion(GenEM)的新方法,用于自动生成富有表现力的机器人行为。GenEM利用LLMs中丰富的社会背景和它们根据指令或用户偏好生成动作的能力,来生成适应性强且可组合的机器人动作代码。这种方法使用少量样本的链式思维提示(few-shot chain-of-thought prompting),将人类语言指令转换为使用机器人可用和学习到的技能API的控制代码。
代码和详细论文讲解在gzh:AI机器人日记