Pi创始人斯坦福Chelsea Finn专访：工程师家庭出发，和10年战友Sergey走过机器人训练漫漫长夜丨独家...

智源社区

于 2024-08-26 12:30:51 发布

阅读量409

点赞数 11

文章标签：机器人人工智能

本文链接：https://blog.csdn.net/BAAIBeijing/article/details/141577188

版权

出生于加州一个工程师世家的Chelsea Finn，从小最喜欢的是拼图和数独游戏，和父母比赛谁算得快似乎成了家庭餐桌上的保留节目，而真正的科研启蒙则来源于中学时代的机器人编程竞赛。

「我中学时用乐高玩具钻研过机器人技术。六人小组，FIRST乐高联赛中，给机器人编程去完成某些任务。这段经历对我的研究生涯很有帮助，尤其是如何调试。这些机器人系统往往起初不能运行，你需要不断调试，并改正方案。」

关于调试系统的初心，在Chelsea此后多年的科研生涯中一以贯之。

伯克利的冬季，晚间5点天已经彻底黑下来，寒夜漫长，而Chelsea的机器人训练工作才刚刚开始。

「不同光线条件会影响机器人，我们希望光线条件变得更可控。幸运的是，冬天5点就天黑了。如果我们在下午五点之后做实验，光线条件就会具有一致性，因此所有的实验都在天黑后进行。」

从简单任务到复杂任务，从几十平米见方的小房间默默训练，到能「炒菜做饭」的ALOHA家务机器人火爆全网，这个过程几乎花费了近10年的时间。目前，Chelsea及学生Tony Zhao团队发布的机器人已经在实施外科手术任务，并且已经拓展至真实的动物体上。

2024 年年初，Chelsea Finn 联合10年来的合作伙伴伯克利「学术狂魔」Sergey Levine 创立机器人初创公司 Pi，又为学术界、产业界投下一颗「重磅炸弹」。在此之前，四位明星创始人已并肩作战多年，相似的经历和思想高度统一让他们选择毫不犹豫地走在了一起。Chelsea Finn 正一步步向着「大规模通用机器人平台」的目标迈进。

与此同时，她又从当代女性的视角深入关心着女性研究者的生活与发展。她一直积极帮助女本科生申请博士项目，目标是让实验室的性别比例尽量平衡，优于平均水平。她秉持着一颗赤诚之心致力于帮助低收入家庭学生，在她的实验室里，不乏来自孟加拉和苏丹等国的学生们。

在本期智源访谈中，我们将为您揭秘 Chelsea Finn 的成长经历，共同探寻其研究、创业背后一点一滴的故事（为方便流畅阅读，笔者进行了不改变原意的编辑）。

智源专访栏目意在展现行业顶尖技术研究者和创业者的研究经历和故事，记录技术世界的嬗变，激发当代AI从业者的创新思维，启迪认知、关注突破性进展，为行业注入灵感光芒。本次专访为总第19期

简介

Chelsea Finn是斯坦福大学计算机科学与电气工程系的助理教授，领导IRIS实验室，致力于通过大规模机器人交互研究人工智能。Chelsea博士毕业于加州大学伯克利分校，并在麻省理工学院获得了电气工程和计算机科学的学士学位，还曾是Google Brain团队的一员。Chelsea Finn博士谷歌学术引用数为56787。据报道，她于今年年初联合创立的Pi已经从OpenAI、红杉资本等方面获得了7000万美元融资。

采访：李梦佳

整理：李梦佳、熊宇轩、赵明华

从工程师世家到MIT，起源于数独游戏

最初是什么激发了你对这个领域的兴趣？什么事件促使你决定去做机器人研究？能否简单介绍一下您个人成长、求学和职业发展经历？

我出生于加利福尼亚州的一个工程师家庭，我从父母那了解到，工程学就是一门解决问题的学科。我母亲是化学工程师，父亲是土木工程师，都是和计算机科学很不同的领域。所以我们并不会谈论具体的工程问题。但是我小时候喜欢和父母一起玩拼图游戏、数独游戏，还会比赛谁的速度快。总的来说，我父母一直都很支持我。

从孩童时代起，我就一直对数学和科学问题感兴趣，也很喜欢动手解决问题。除了计算机科学，我还喜欢生物学。我曾经设想过投身于计算机科学和生物学的交叉领域工作，比如遗传学领域，药物设计。

我对机器人也很感兴趣，我在中学的时候用乐高玩具钻研过一点机器人技术，当时有一些针对中学生的 FIRST乐高联赛项目，我们有一个六个人的小团队，负责制造机器人，给它们编写程序，让它们去完成某些任务。你可以从中学到一些东西，比如研究怎样让本来无法工作的系统实现正常运转，进行调试和设计。这段参与乐高机器人竞赛的经历对我后来的研究生涯很有帮助。特别是调试的部分，这个过程很像工程学，计算机学和机器人学中的某些环节。这些机器人系统起初往往是不能运行的，你需要不断调试，并且改正方案。

FIRST乐高机器人联赛

在MIT的时候，我主修了计算机科学。学习这个专业可能会让我有更多的机会，可以去研究与生物相关的领域，或者其他一些领域（例如，机器人或者航空航天领域）。我在MIT的第二年也学过机器人技术课程，并且还是这门课程的助教。

在MIT的第三年，我被AI深深吸引，深刻认识到AI领域有着对世界产生巨大影响的潜力。同时，我意识到做软件工程不如做研究更能吸引我。我很想探索AI领域的前沿，特别是在学术界开发算法。

我很热衷于去解决技术难题。所以，我希望开发出能够真正走出实验室的机器人，以一种智能的方式与人们进行互动，能在现实世界中承担起实际任务。这类任务对人类来说可能只是日常琐事，但在技术上却颇具挑战。如果我们能够实现这个目标，或者取得一些显著进展，都能为我带来成就感。

在伯克利寒冬的实验室，与 Sergey Levine一起，在5点天黑后做实验室

在伯克利读书期间，有什么值得分享的故事吗？

在Berkeley读书的第一年，我决定投身于机器人和深度学习研究领域。

当时，大多数人都没有把机器学习用在研究机器人技术上，尤其是学习控制。我们做了一系列用神经网络训练机器人的实验。我们在伯克利工作的实验室就是一个小房间。虽然从平面图上来看很大，但是机器人只是其中的很小一部分。我们现在已经拥有了许多实验室和许多机器人，我们也聚合了一些数据。目前我们的数据比十年前拥有的要广泛很多，这也说明这些领域从十年前开始就已经在进步了。

我从 2014年9月开始就和 Sergey Levine 一起合作，这段合作关系已经持续了10年之久。当年，Sergey还是Berkeley的博士后，他在用神经网络通过强化学习训练机器人的方面做出了突破性的进展。起初，他并没有完全察觉到这项工作的意义。那之后我们开始合作，试图训练端到端的神经网络，根据给定图像输出控制策略。

我还记得那些我们一起研究机器人的漫漫长夜。

不同的光线条件会影响机器人，我们希望光线条件变得更可控。幸运的是，那是在冬天，下午5点就天黑了。阳光会透过实验室的窗户洒在机器人身上，如果我们在下午五点之后做实验，光线条件就会具有一致性，在我们训练机器人时，光线条件会和我们评估策略时保持一致。因此所有的实验都在天黑后进行。最终，我们确实训练出能够执行任务的策略，比如拧上水瓶的盖子，放置一个积木，将积木插入一个立方体中。这是非常令人兴奋的结果。

实际上，我们之后通过可视化工具，认识到我们提出的方法对不同的光线条件都有着很强的鲁棒性，但当时我们并不知道这一点。安全起见，为了不重新做所有的实验，我们保持了一致的光照条件。

现在，在机器人学领域中，这样的工作已经成为了「常规操作」：为了得到控制策略，训练一个神经网络表征事物，这与最优控制或其它传统方法不同，是领先的训练机器人的研究方法。

这是我们在训练机器人和神经网络的过程中一个初步的尝试。当时，我们还没有意识到，我们也可以在使用模仿学习方面取得大的成功。

从人类的角度去考虑，在数据很匮乏的情况下，如果想要用短短十五分钟的视频数据训练机器人，这确实听起来有些疯狂。这就相当于，你要在一个婴儿学会拿起物体之前，教他如何使用铲子或者拧上水瓶。然而，为了开发能在不同环境下工作的机器人，这是我们需要迈出的第一步。

这样的训练似乎与之前有所不同，我们不希望得到的策略泛化性能很差，而是希望可以通过同一套方法训练机器人完成多种任务。这样一来，我们就可以用更多的数据和计算来进行扩展，最终训练机器人做多种不同的工作。

从小样本学习到大规模机器人训练平台

在这十年里，您职业生涯中的亮点是什么，有什么重要的发现？

在我攻读PhD的期间，最满意的工作莫过于研究元学习（meta learning）和小样本学习（FSL），去证明可以准备一个神经网络，用来快速适应少量的样本。

我们在上下文学习中的FSL和用于语言模型的神经网络方面有了一些新的发现。我认为这很有影响力。实际上，我们使用FSL技术部署了一些教育系统。我们也看到该技术在药物开发等领域得以应用。我们希望机器人技术也能从FSL中受益，最后成为一种通用范式。

Chelsea Finn在EmTech Digital现场发表演讲

最近团队取得了一些令人兴奋的进展，例如可以利用视觉语言模型、大规模互联网数据。还可以将语言模型中的语义知识迁移到机器人策略中，这样机器人就可以识别到不存在于他们的训练数据里的对象，并且与它们进行交互。机器人能进一步收集更广泛、有趣的数据。我们能够操作机器人去完成很多不同的任务。

我认为，使用语言模型进行高层规划，实现高层次的机器人适应和推理，都很有应用前景。特别是在让机器人去完成需要思考的复杂动作，而不只是拧瓶盖这样的动作时。

更为重要的是，我们在Google Brain期间开展了一项大型的RTX项目。该项目依托全球20多个不同的机器人实验室构建，收集了来自于22种不同的机器人硬件的大约一百万条数据。只需共享训练的检查点，就能在不同地点的多个机器人上同时运行神经网络，甚至比我们之前专门为机器人开发的神经网络运行的还要好。所以，如果我们只在一个机器人平台上进行交易，这种方法可以为机器人提供更多数据源。

关于 RTX 机器人项目，主要挑战是什么？

你可能会认为，不同的机器人有不同的摄像头角度，机器人以不同的方式完成动作，你可能需要以不同的方式控制它们。因此，处理输入空间和输出空间中的异质性似乎是在训练多个机器人时必须解决的问题。

实际上，在RTX项目中，我们发现至少对于我们所研究的平台来说，你不必以特别巧妙的方式解决这些问题。我们在实验室进行的一些后续工作表明，你可以很轻松地用同一个模型完成训练自动驾驶和操控移动机器人，以及控制机械臂，并且在这两个领域之间实现正迁移。

Sergey 实验室在此基础上开展的包括控制机器人腿在内工作，进展就顺利得多。我认为，主要的挑战是，如果我们有了一个新的机器人，我们能不能去快速适应。这项工作很困难，因为我们目前拥有的机器人平台数量还不足够多，泛化能力还不够强。

因此，如何提升模型的适应性还有待进一步研究。可以想象，一旦拥有了一个新的大规模机器人平台，可以以较低的成本收集一些数据，来学习更多关于新的特定机器人实体的特性。

数据，数据，数据！

手术机器人平台：控制建模与深度学习的结合

最近你的学生 Tony Zhao 等人开发了一个手术机器人平台。这听起来很有意思，你是怎么有这个想法的？

是的。最近，我的学生 Tony Zhao与约翰霍普金斯大学阿克塞尔实验室的研究人员合作完成了一个手术机器人平台项目。他们领导了所有的机器人实验，并且都完成得很好。我们发现，在大多数情况下，我们可以应用在之前的机器人平台上使用过的技术（例如，扩散策略）。

在这一平台的研发过程中，我们面临的最主要的挑战是：外科手术机器人不能精确地测量工具的位置和方向。在你控制机器人的时候，必须要考虑到这一点，需要确定工具在一个空间中的具体位置。为此，我们开发了一种相对运动公式，它允许机器人校正其运动学上的错误，完成非常精细的任务。

如今，我们能够巧妙地去选择机器人的动作表现形式，并将其与平台上收集的数据相结合，我们采用的是类似于「达芬奇机器人」那样直观的手术方法。实际上，我们之前为精确操纵机器人、实现远程操作而开发的一些系统，在很多方面都与「达芬奇机器人」系统相似，这为我们的项目提供了很好的基础。

外科手术机器人模拟手术过程

这和现实生活中的手术情景完全不同。在真正的医疗实践中，怎样才能使它可靠呢？

目前，我们正在积极进行后续工作，寻找更接近真实的、可控的静态场景，数据在这个过程中起到了重要的作用。原则上，我们希望从被广泛使用的手术机器人系统中获得大量数据。但是，很多数据是不公开的，它们就像专利一样。因此，问题就在于，我们要找到一种可以获得数据的方法，或者利用现有的数据训练机器人的方法。目前，我们正在已经死亡的动物体上实施真实的外科手术子任务。一旦我们完成这项工作，就会发表相关论文。目前已经有了一些研究成果，但项目还在推进中。

对齐模拟数据与真实世界

在那些接近真实的场景中，我们如何才能获得真正有效的数据？如何确保模拟数据与真实世界一致？

我认为，无论是在物理层面，还是在视觉层面上，其实很多模拟数据与真实数据有很大的区别。在视觉层面上，我们有很强大的图形引擎（graphics engines）生成图像。但在物理层面上就比较困难了，不仅仅要模拟世界，还要模拟各种变化情况。

比如，在一个普通的桌子上，桌面上可能会有一些污垢或者残留物，这会影响物体在桌子上的滑动方式，要找到所有这些影响互动性的小细节是很有挑战性的。

我们的研究使用了很多真实的机器人数据，这对于开发通用机器人来说非常重要。模拟数据可能也会起到重要作用，但仅仅使用模拟数据仍然不够，尤其是在训练机器臂操作物体方面。

要模拟现实世界中事物和行为的多样性是很困难的。因此，许多机器人的模拟结果都局限于抓取物体、放置物体上。

有的研究人员或许会采取另外一种方法，把现实世界中的知识和具体任务的数据结合起来。例如，通过采用「离线预训练+人在回路」的方式。这样，通过将一些相关的人类知识「内置」到系统中，可以获得更加高效的结果。通常，这些系统往往会做出一些假设，但这些假设并不适用于我们想让机器人完成的任务。它们成功的条件十分特殊。

在一些情景下，我们会更关注如何去开发更专用的机器人。我们对于在工厂里做着重复的工作机器人，与做家务、超市里的补货机器人的约束完全不一样。所以，我认为沿着不同的脉络进行研究是很有价值的。

在我看来，我们可以在大量高质量机器人数据上进行预训练，这些预训练模型具有良好的表征能力，能够确定在不同情境下采取何种合理行动。然后，在微调阶段，可以根据不同的任务和使用情况来适配。比如，利用强化学习让机器人通过自己的经验来改进。

大语言模型时代的机器人系统训练与评估

现在在这个领域里，短期、长期来看需要解决的基本问题是什么呢？

上述方案在某种程度上，确实让语言模型在机器人领域取得了很大的成功，这是我们都有目共睹的。

语言模型如今已经相当成熟，值得机器人领域的研究者学习。但我认为，有一个很重要的不同点，就是我们目前并没有像维基百科和各类书籍那样丰富的语料来进行预训练。因此，我们必须精心选择要使用的预训练数据集。目前我们已经开始收集大量的数据，同时，我们也准备利用互联网知识结合机器人数据，进行预训练。

所以，我们可以利用视觉语言模型，把它们作为预训练过程中的一环。因为这些类型的模型可以让我们得到一些常识性信息，这对机器人训练很有用。在部署机器人时，我们通常还会收集一些高质量的数据来对其进行精细的有监督微调。

在语言建模场景中，我们很难把这个问题当做一个典型的「多臂老虎机」问题去处理。机器人控制本身类似于一个序列建模问题，我们的目标是开发一个控制机器人身体的大型基础模型。

在这个研究方向上，仍然存在许多有挑战性的问题。例如，如何收集数据、判断哪些数据对人工智能系统最为有用。无论是在预训练还是训练后的部署阶段，都存在一些挑战。

此外，在机器人领域，如何评估现有的系统一直是一个难题。运行机器人，并且观察它的功能需要耗费很高的成本。如果要打造一个通用的系统，评估成本会更高。类似地，在语言模型领域，评估一个AI系统的优劣涉及众多不同的维度、标准和个人偏好，这些都可能影响我们对这些系统的评估结果。如何有效地进行这种评估，是一个亟待解决的重大挑战。

我认为，探索对系统进行后训练的策略以及确定监督的具体形式极为关键。这涉及到一个根本问题：我们如何确保系统得到适当的监督指导？更重要的是，系统是否能够自主地表达它们对监督的需求，并利用这些监督来实现自我提升，这种自我提升的能力十分重要。

我们在机器人技术和语言模型的发展中已经目睹了自主提升的成功案例。但是，为了让这种自主改进的过程变得更加广泛适用，并且能够像传统的监督学习那样轻松实施，我们依然还有许多问题要解决。

创业之旅：顶级明星局，四位老友齐聚一堂

机器人大模型创业的绝佳时机

五个月前，你和其他几位科学家一起创立了初创公司Pi，激励你创业的动机是什么？

是的。尽管时间并不算长，但我们已经取得了一些成果。

我们很热衷推动技术的发展，希望通过不懈努力，实现深度成熟的技术，使其能够在现实世界中发挥关键性作用。这一目标是我们的最终追求，也是驱动我们不断突破和创新的动力。综合考虑，我们认为成立一个以盈利为目标的初创公司，是实现该目标的最佳途径。

我们观察到，过去一年里，机器人领域有了显著的进步。当然，我们无法完全确定，何时才是创业的最佳时机。我们可能还处于探索阶段，相比于五年前，现在也许是个好时机。我们有信心在当前环境下取得更大的进展。

如果我们能成功打造一个可以控制任何机器人做任何任务的基础模型，其潜在的全球影响力将难以想象，这样的技术至今尚未问世。这项技术有望在各种劳动领域产生深远的影响，同时为任何需要智能操作的场景带来变革。Sergey和我在不同的时间点讨论过很多不同的想法，同样，Brian (Ichter) 和Karol (Hausman) 也在不同的时刻讨论过一些想法。最终，我们四个齐聚一堂，把想法介绍给我们接触到的人。这是整个团队的功劳。

未来，机器人的应用将不再局限于家庭中的单一功能，而是扩展到各种智能设备，在多样化的场景（例如，杂货店、工厂、办公室、建筑工地等）中以某种创新的方式被利用。

我们也注意到，许多投资者愿意在这种创新项目上去冒险。也正是他们对高风险长期投资项目的支持和信心，让我们能在这个关键时刻作出决定。他们给予的支持，是我们能够推进项目的重要因素之一。这个领域确实有很大的发展潜力，但显然也充满了挑战性。我们的投资者也深知这一点。我们向他们说明了所有的挑战以及未知因素。

同时，我们也向投资者们展示了团队实力。我对我们的研发团队感到无比自豪。我们的创始团队不仅拥有丰富的经验，但同时也保持着年轻的心态，对挑战保持开放和乐观的态度，不拘泥于传统思维。我们渴望探索研究上的难题，去寻找解决复杂问题的创新方法。

Chelsea Finn与团队伙伴

搭建顶级创业天团：共同的经历与思想让我们走在一起

你们的团队很强大，每个人之间是怎么合作的？怎样进行分工的？彼此之间怎么划分责任？

我们成功地吸引了一批杰出人才加入我们的团队中。从项目启动之初，我们就坚信能够招募到优秀的团队成员。我认为，Karol和Brian在该项目的实现中起到了关键作用。团队成员有丰富的合作经验，取得过诸多成果。所以这一次，我也相信我们能成功。

在分工方面，我主要负责数据处理以及制定适用于复杂任务的有效策略。Sergey就主要负责去思考如何训练大模型，还有探索如何使用强化学习来优化我们的模型。Karol是CEO，他肩负着众多关键职责，参与了公司很多重大决策。虽然目前他没有在技术领域直接指导工作，但是他在公司很多关键部门中都发挥着核心作用。

我们团队还有其他几位创始人，Adnan是团队的硬件领域负责人，主导硬件战略的制定。虽然我们是一家以软件为核心的公司，但是硬件的发展可以助推我们实现目标。例如，通过开发更先进的远程操作界面，构建更鲁棒的远程操作机器人。

Lachy Groom，有广泛的投资者人脉，更多参与运营工作，特别是在数据收集方面，他有着非常严谨的运营策略。他也投入大量时间去和潜在投资者沟通，为公司吸引了未来的投资机会，使得我们能够专注于业务本身。

我们需要站在同一战线上，彼此之间进行有效沟通。在面对各种需要做决策的问题时（比如确定事项的优先级，制定战略等），我们需要不断去在战略上追求一致，实现我们共同的目标。

挑战总是不期而至，如果最初团队没有统一思想，会带来很大的隐患。通常我们都能够妥善应对各种决策，即使在面对充满挑战的选择时，我们也能够做到倾听并吸纳不同的意见。

之前我们中的很多人就有过合作经历，我们之间建立了深厚的信任。在我们工作时，这份信任显得尤为宝贵。我们也很尊重彼此。当团队中有人提出建议，我们应该去做出改变，我们都会去认真倾听。信任、共同经历、思想一致以及共同的目标，这些因素都促进了我们彼此之间的合作。

Physical Intelligence团队名单

自信而谦逊，摸索与投资人的合作之道

你们收获了OpenAI、红杉资本投资超 5 亿美金，有没有什么关键信息或策略，在向投资者展示后，能够使投资过程变得既顺畅又迅速？

起初，我对于和投资者交谈的整个过程都很陌生，与研究工作中沟通的方式大相径庭。

主要是向他们介绍了一些关键信息。比如，我们正试图快速行动、迅速学习；我们希望快速地将机器人推向市场，迅速从中学习经验。同时，我们还强调了我们的团队很强大，但是有些时候谈论这些容易使人感到尴尬。我们需要找到一种谦逊的方式，去表现我们的团队很强大，至少是一支有能力去面对这些挑战的团队。

此外，我们不能盲目遵从投资人的想法，要不忘初心。我并不认为有什么秘诀能让人轻易投资。投资是一个深思熟虑的过程。投资者会对创始人进行考察，我们也会评估想法的可行性。这不只是单方面的决策，而是一个涉及多方信息收集和评估的互动过程。

师道传承，致力于帮助低收入家庭学生

我对您在帮助弱势群体方面的工作非常感兴趣。您能分享一下这段经历吗？

我在伯克利「BAIR」工作期间，投入了大量精力帮助弱势群体。我主要负责指导那些家庭经济条件较差的高中生，他们中的很多人将要成为家里的第一个大学生，或者是来自低收入家庭。

伯克利“BAIR Camp"宣传页

我们设计了一套课程，旨在向他们介绍编程和人工智能的相关基础知识，让他们能够接触到这些先进的概念，激发他们的兴趣，从而在他们心里播下求知的种子。我参与了课程内容的开发，实际上，第一年授课教授的课程中大约有一半是我设计的。到了第二年，我不仅继续参与课程的扩展，还与参与该项目的学生们进行了深入的互动。

在美国，家庭背景和经济状况确实可能会对个人发展产生很大的影响。因为如果你需要为了补贴家用去做一些兼职，你就不能参与到像我中学参加的乐高机器人这样的项目中。这还可能会影响你在学校的学业和专注力。所以我认为这些因素会影响一个人的学术和职业道路。

我认为，大学在招生的时候也会考虑到这些背景因素。另外，即使一个学生在他所在的圈子里表现得很出色，一旦他们进入大学，与那些高中时期就有很多机会和资源的学生做同学，可能会让他们感觉自己处于劣势。对于他们来说，还要努力去适应大学的学习环境。

对于他们来说，在这条道路上存在着种种挑战，想要获得成功确实很困难，但是绝非不可能。在我Stanford的实验室里，有很多来自低收入家庭的学生们，他们表现得都很好。比如，我们有一位来自孟加拉的学生，表现很出色。另一位学生出生在非洲的苏丹，他现在是该国毕业于卡内基梅隆大学人工智能领域的首位PhD。此外，还有一位学生，她是家族中第一代大学生。这些例子表明，来自低收入家庭的学生们依然有机会取得成功。当然，这一路上充满了挑战，许多因素都可能影响他们的学习和发展。

我一直都想要创造一个包容的环境，并且尽我所能地去帮助那些来自较差背景的优秀学生，我相信每个人都应该有机会在他们选择的领域里发光发热。当然，作为个人能力有限，能亲自指导的学生也很少。

但是值得一提的是，我实验室里的一个学生Mujin，一直在组织一个叫“Deep Learning Portal（深度学习门户）”的新项目，以帮助更多类似背景的学生了解深度学习领域，并确保他们能够得到必要的指导。

呼唤更多女性机器人研究者

您一直关注提高计算机科学和工程领域女性的地位。能否分享一些特别难忘的经历呢？

我投入了许多时间与对人工智能等学术领域职业发展感兴趣的女性进行交流。我协助组织过一个项目，专门面向斯坦福大学中资历不足的本科生找到研究机会，并且理解申请PhD的流程。

我也为实验室的女本科生们提供了帮助。她们在上一个申请周期中申请了PhD项目。我很高兴，其中有三人被一些非常优秀的PhD项目录取，而且其中的两人将进入斯坦福大学。这都是让我在过去这一年里很自豪的事情。虽然这些都是小事，但很有意义。

我也一直在尝试让我实验室的性别比例尽量达到平衡，虽然目前还没完全平衡，但我的目标是至少要优于平均水平。

通常，斯坦福PhD项目的录取女性比例与申请者中的女性百分比大致相当。这在一定程度上反映了人才输送的情况。但随着学术级别的提高，可以观察到女性数量在减少，这是我们希望能够改进的地方。

总的来说，我认为斯坦福大学的计算机科学系，在教师层面上，女性比例实际上是相当好的。尤其是在机器人领域，女性教职工的数量甚至超过了男性，尽管整个系的女性教师并不占多数。

给年轻研究者的一些建议

对于年轻研究者在职业方向或职业选择方面，你有什么建议？

当投身于自己真正热爱的项目时，我们会有更多的激情。因为这些工作对我来说，不只是任务，而是一种让我愿意去投身的事业。我认为，这种选择让我取得了很多成功。因为我享受这个过程，并因此更加投入。研究工作无疑是充满挑战性的，但是至少对我来说，投入更多的时间和精力，就会更容易成功。

此外，在确定研究目标时，需要考虑多种因素。你可以先设定一个宏观目标，然后去逆向回溯，找出哪些子问题有助于解决宏观的挑战。同时，选择问题时也需要谨慎，如果问题过于困难，或者条件尚未成熟，都很难取得进展。例如，如果在10年前就开始研究自动驾驶汽车，那可能还为时尚早，因为当时还没有足够的知识和技术来支持你的研究。

举个例子，在我开始考虑PhD项目时，我确实犹豫过是否要转向生物学领域，而不是从事机器人研究。我和一些专注于计算生物学的博士生交谈过，他们建议我，如果想要站在机器学习研究的最前沿，那么计算生物学可能不是最佳选择。无论是从数据集还是解题工具等方面，当时的计算生物学领域相对缺乏组织。所以我选择专注于机会更多的机器人学。因为我相信，相比于计算生物学，机器人学能够产生更深远的影响。这也表明，我们的目标优先级往往会受到领域当前发展状况的影响。

如今，我认为花些时间去考虑自己想要达成的成就，以及在某些特定时刻应该优先考虑的事情，是很有价值的。你还需要去反思一下你的时间分配是否和目标相契合。

- 推荐阅读 -

独家丨专访宇树创始人王兴兴：偏科不可怕，只要把擅长的事做到极致

14万引用Sergey教授专访：好研究没有妙计，不好的研究却千篇一律丨独家

智源社区

关注

11
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
Pi创始人斯坦福Chelsea Finn专访：工程师家庭出发，和10年战友Sergey走过机器人训练漫漫长夜丨独家...

出生于加州一个工程师世家的Chelsea Finn，从小最喜欢的是拼图和数独游戏，和父母比赛谁算得快似乎成了家庭餐桌上的保留节目，而真正的科研启蒙则来源于中学时代的机器人编程竞赛。「我中学时用乐高玩具钻研过机器人技术。六人小组，FIRST乐高联赛中，给机器人编程去完成某些任务。这段经历对我的研究生涯很有帮助，尤其是如何调试。这些机器人系统往往起初不能运行，你需要不断调试，并改正方案。」关于调试系统...
复制链接

扫一扫