看17年的机器人强化学习论文,采用模仿学习时,有的论文采用第一人称演示数据,有的论文采用第三人称演示数据,初看第一人称和第三人称,以为是描述相机的位置。
在 THIRD-PERSON IMITATION LEARNING
这篇论文中提到了解释:
第一人称:the agent is provided with a sequence of states and a specification of the actions that it should have taken.
第三人称:they observe other humans perform tasks, infer the task, and accomplish the same task themselves.
通俗地讲:第一人称是看自己演示,演示轨迹中的观测和action与测试时一样;第三人称是看别人演示,演示轨迹中的观测和action需要转换到第一人称。