Pieter Abbeel standing next to BRETT, the Berkeley Robot for the Elimination of Tedious Tasks. (Photo by Adam Lau, Berkeley Engineering)
在正文开始前,小编想先分享一下这篇论文创作团队的背景情况。
足式机器人的派系
盘点足式机器人的几个山头,主要有两个派别,分别是偏控制领域的机器人派和用强化学习做具身智能的AI派。
机器人派和AI派的划分主要还是源于人形机器人软件控制的迭代。人形机器人的控制算法主要分三代:第一代,用简单的基于模型的控制算法(LIPM+ZMP),代表机器人ASIMO;第二代,动态模型控制和最优控制算法(MPC+WBC),代表机器人Atalas;第三代,模拟+强化学习。
这些算法各有优劣,我们这里不做过多技术上的探讨。但就从事研究的人来说,第一代和第二代基于模型控制的算法一般是控制、自动化或电子系的人在搞;第三代Sim+RL的算法,一般是计算机系AI方向的人在搞。小编今天分享论文的创作团队是属于偏向第三代这种基于AI来交叉Robotics的学者。
整个Robot Learning领域,或者说AI+Robotics,UC Berkeley可谓一手遮天。在知乎上看到一个说法:“其他学校的实力甚至相当程度取决于距离伯克利的地理距离…”,从CoRL接收论文作者的统计来看,还真是这样,排名第一UC Berekely,第二Stanford,第三UW。
创作团队的背景情况
UC Berkeley AI+Robotics这个领域最强是Pieter Abbeel派系,他是将深度强化学习应用在机器人方面的先驱人物,于2021年获得ACM 计算奖的荣誉。在获奖公告中,ACM 提到:「Pieter率先教会机器人从人类演示中学习(模仿学习)和通过自己的反复试错学习(强化学习),这为下一代机器人技术奠定了基础。」
Pieter Abbeel现为加州大学伯克利分校计算机科学与电气工程教授,伯克利人工智能研究实验室(BAIR)的联合主任,伯克利机器人学习实验室(Berkeley Robot Learning Lab)主任,他最出名的是在机器人和机器学习方面的前沿研究,特别是在深度强化学习(deep reinforcement learning)方面。他于2000年获得比利时鲁汶大学电气工程学士和硕士学位,并在斯坦福大学获得计算机科学博士学位。Pieter Abbeel是AI大牛吴恩达的第一个博士生,这里值得一提的是吴恩达博士论文就是RL领域,但他后期的工作没有在RL这个领域继续,Pieter Abbeel作为吴恩达的第一个学生,延续了吴恩达在RL的传承,并成为当今RL+Robotics最强的一个派系。
Abbeel在AI+Robotics