写在博士旅程之前 博士第一年 博士第三年 博士第四年_谢存禧新闻

读博士这件事,想法一直都有。2015年硕士毕业前去西雅图参加ICRA2015,顺路跟着导师李泽湘到他年轻时的好基友沈向洋先生家做客。导师站在沈向洋先生的豪宅前开玩笑地说:“看一下以后奋斗的目标。”而逛了一圈,我印象最深的是他书房里最显眼的位置挂着的博士学位证书。Doctor of Philosophy in Robotics ,这是这位人生赢家最让我羡慕的地方。2016年,带领大疆的智能导航团队保障Phantom 4顺利发布以后,我觉得我已经清楚了解了多旋翼的控制和智能导航相关的技术,这个领域不再有开创性的研究问题需要被探索了,我就有了去读博士的想法,找一些更有挑战性的机器人学问题去探索。2016年中我开始做大疆创新在我心中最牛逼最激动人心的新项目——RoboMaster,为此把读博士的梦想耽搁了两年。2018年终于是个好时机让我开启人生的下一阶段了。

这是一个非常疯狂的想法,但是我能够感受到内心的召唤,愿意为此突破一些障碍。比如后来每次有人和我谈起沈向洋作为华人圈最成功的高管的种种事迹的时候,我首先想到的总是我站在他的博士学位证书前感受到的羡慕和向往。比如在刷朋友圈的时候看到科技新闻,相比起成功融资、成功上市的企业家的新闻,我还是从心底更佩服那些在科研工作上做出成果的科学家的新闻。尤其是现在这个时代,机器人学的未来该何去何从,尚未有定论,亟待科学家们的探索,这是需要探索和梦想的年代。虽然我在公司里有一些进展顺利的项目,但是科学上的挑战不多,而且公司里面专心科研的机会非常少,还是要回到学术机构才能比较高效专心地展开工作。

另外在大疆的树荫下待久了,容易滋生自己很牛逼的心态。因为导师和大疆的成功,我也狐假虎威地跟着老板们接触了一些以前只在新闻上看过的名人,也接待了很多学术界和工业界的传奇人物来参访大疆。但是这都不是我自己的能力所能达到的,我想靠自己的科研学术能力去让别人认可我。很多人年轻时都怀抱着改变世界的理想,我比较幸运的是已经和一些很厉害的人参与了一件改变世界的事情,因此对这个理想早已释怀。比起改变世界来说,做好自己更难。

2016年底抱着试一试的心态我开始了第一次申请。由于RoboMaster和公司其他项目繁重,我没考TOEFL和GRE,只改了改简历、写了写文书申请了加州大学伯克利分校(加州大学伯克利分校可以不需要提交TOEFL和GRE成绩)。因为我的研究生导师在加州大学伯克利分校有很强的影响力,所以2017年2月我拿到录取通知,可以在17年秋季入学。

和大疆的同事以及妻子商量以后,觉得17年不是一个去读博士的好时机,他们都以为我16年只是随便申申,所以并没有准备好。我的工作交接不出去给别人,老婆也没做好跟我一起去美国的准备。所以我和伯克利沟通了一下之后,把offer推迟到了18年再入学。

在拿到伯克利的录取前后,我也受邀到卡内基梅隆大学的机器人学院介绍大疆的无人机技术和RoboMaster这个机器人教育项目。所以2017年的3月,我首先在卡内基梅隆大学机器人学院做了一次seminar,然后去加州大学伯克利分校参加给博士学生组织的校园开放日。

两个地方给我的感觉是截然不同的。3月的加州伯克利阳光温暖和煦,四处充满着生机,加州大学伯克利分校作为世界科技中心的主要学术机构之一,人们都在兴奋地讨论人工智能、自动驾驶和区块链;而3月的宾州匹兹堡冷风刺骨,街道透出衰败的气息,卡内基梅隆大学作为锈带区复兴的唯一希望,人们显得更加谨小慎微。虽然有不少科技公司在匹兹堡开设分支办公室,但大部分卡内基梅隆大学的学生都会在毕业之后去硅谷,而加州大学伯克利分校的学生们已经在宇宙中心了,我想这让他们的学术科研以及生活的方方面面都有不同的思考。

两相比较下来,我发现我更想去卡内基梅隆大学读博士。

卡内基梅隆大学机器人学院的很多教授和学生非常热情地欢迎了我。他们知道我是做什么的,我在大疆的工作已经帮助到了很多机器人学院的人,甚至有人知道DJI SDK是我主导并架构的项目。在机器人学院负有盛名的Field Robotics Center,遍地都是大疆M100和M600飞行器,至少三个科研和创业项目以大疆飞行器为核心。一个机器人学院的学生骄傲地给我展示了他的工作,他在M100上增加了激光雷达,通过调用DJI SDK中控制飞行器的API,实现自动桥梁巡检,他说奥巴马离任总统之前来卡内基梅隆参观的时候也看过他的项目。在机器人学院的官网上,一台由M100改造的空中机器人和很多其他卡内基梅隆造出来的著名机器人被展示在了一起(题图)。

而在另一边的加州大学伯克利分校,人们对我的态度不愠不火,很少有人听说过大疆这家公司。抛开多旋翼飞行器不说,我参观了很多伯克利的实验室,但是没有看到什么特别令人惊奇的机器人项目。

他人的态度不应该作为做出选择的依据,既然我决定离开国内的人脉圈和大疆优越的环境去读博士,就应该做好从零开始的心理准备。我这样说,只是结合我的观察和感受,思考了这样一个问题:两个地方人的态度,反映了他们思维方式和做事方式的不同。

加州大学伯克利分校的计算机专业和卡内基梅隆大学的计算机专业都很强,不分伯仲。两个学校的计算机专业对自己学校机器人方向的研究却有着不同的影响。在我看来,伯克利的计算机专业和硅谷周围偏软件互联网的环境吸收走了资源,一些本可以研究机器人的优秀人才都去做纯软件方面的科研工作了,工作的目的多半也是为了到硅谷创业。计算机科学非常契合人们对个人英雄主义的追求,一个人单枪匹马发明了一个算法或者一个软件工具解决了一个重要的计算机科学问题、开办了一家公司,这是非常常见的,而且很容易受到媒体和社会的关注。在伯克利参加校园开放日的时候,有一个session是教授们轮流上台讲自己的research来吸引学生,好几个教授在介绍的过程中都会说啊你看我这个工作已经创了业融了资,或者说啊我这个工作虽然充满了蛋疼的数学但也是能创业的……

和计算机科学领域的研究不同,机器人是综合性学科,不能用计算机科学领域的思路去研究,鲜有人能单枪匹马做一个机器人出来,大家必须一起合作。后来沈向洋在他的一篇文章里也谈到了这一点:

……麻省理工大学每个人都是一头虎,而卡内基梅隆大学出来的都是一群狼。我们很少单打独斗,都是一个团队一起做一个大项目,卡内基梅隆大学最出名的都是大项目。所以卡内基梅隆大学成功的地方是培养了很多大的IT公司CTO级别的人物,很多学生在工业界更加成功。
做大项目就意味着成果不那么容易出,而且大家需要花很多时间进行工作的讨论和同步。另外机器人相关的大项目一定需要工程师和科学家的协作,由工程师制作基本的机器人平台,机器人科学家在上面进行科研探索。卡内基梅隆大学有非常完善的工程师和科学家协作的制度,甚至进行教学工作的教授就分研究型和工程型两类。机器人学院虽然架构在计算机学院下面,但是计算机学院并没有非常强势地把控机器人学院的研究方向,机器人学院在人类做机器人的历史上功名赫赫,能够持续地吸引优秀的人才。更重要的是,机器人学院跨学科交叉的制度吸收了很多ECE和meche的学生一起进行科研。

因为卡内基梅隆大学的协作制度和做大项目的能力,他们和工业界的联系非常紧密。他们能很快把握工业界的动向,很快地把一些工业界的产品用到科研当中,比如大疆的Matrice飞行器。而加州大学伯克利分校则没有这样的协作机制,机器人项目也基本仅由最强势的EECS专业把控,很少能组织起背景丰富的交叉型团队。

这么说并没有轻看伯克利的意思,相反我相信伯克利可以让精英更精英。我只是认为,机器人是狼群做的事情。独立去做研究的话,和辛湜、贾扬清这样优秀的伯克利学生比起来,我在工业界浅尝辄止的背景和编程能力,更像一匹狼,在伯克利应该是很难做出什么成绩的。所以我想再申请一次,去卡内基梅隆大学。

另外,一些和学术不相关的东西也影响着我。匹兹堡作为上世纪美国工业重镇的历史总是让我时不时联系起我的家乡——中国的工业老城山西太原。太原和匹兹堡一样在国家发展的过程中有重要的地位;一样是受益于煤炭和钢铁;一样也在国家发展进入新阶段以后城市的发展出现了停滞。我能在匹兹堡的街道上嗅出一些在太原街上也有的气息,让我感觉很熟悉。

4月份我回太原的家里探亲,整理小时候看过的百科全书时随手翻了翻,在某一页赫然看到一个机器人被注明是卡耐基梅隆大学的机器人学院所研发。我这才惊讶地发觉,虽然现在完全不记得,但是可能十几年前当我立志想做一个科学家的时候,曾经被机器人学院所激励过。

2017年4月11日,王小波逝世20周年。我买了张佳玮非常推崇的《万寿寺》来看,又从前言里了解到,王小波曾在匹兹堡大学陪他的妻子读书,他当时的好朋友、也在匹兹堡大学学习的丁学良后来成为了香港科技大学的社会科学教授,我在香港科技大学读书的时候也听过丁学良教授的课。想必匹兹堡这个地方深深影响了他们写作的方式和对世界的看法。

作为一个怀念并坚持童年理想的人,一个喜欢历史、社科和文学的人,很容易被这些冥冥之中的联系牵引起来。大家都想去硅谷,但我很想在匹兹堡这个地方多待一待,看看机器人产业如何让这个老城复兴。

2017年6月,在参加完ICRA2017之后,我写了这篇文章《未来的机器人未来》。其实有些读者应该很明显地看出我在这篇文章里表达的个人倾向了。如果去伯克利的话,多半是会按照深度神经网络和增强学习的方法去做一些东西,但是我更想跟随传统的路线。17年的申请季,我重新申请了卡内基梅隆大学。

在写《未来的机器人未来》前后,我也一直在了解深度神经网络和增强学习,一方面是了解这个研究领域,一方面也为2018年举办RoboMaster AI 挑战赛做准备。在《RoboMaster AI 挑战赛科研思路浅谈》这篇文章里我讲了一些自己的思路和想法,遗憾的是,半年过去,我、我的RoboMaster团队、RoboMaster AI挑战赛的参赛学生,都没有实现出增强学习控制的机器人。我自己做深度增强学习,总有一种说不清道不明的失败感:算法非常难收敛、variance很大、极其sensitive,随便改个参数结果会大相径庭、修改参数没有什么理论依据。最近有一篇文章《呵,我复现一篇深度强化学习论文容易吗》,很好地描述了复现一些深度增强学习的痛苦之处。让我感到特别不适的是,机器人系统的精髓——能量的转化和系统的建模——在深度增强学习里毫无用处。机器人上电和磁转化为动能、力带来的运动对外产生力,我们面对的是一个复杂但是一切可知的系统。但是在深度增强学习里这些都用不到,我们调整参数或者调整神经网络的层,参考依据居然不是牛顿运动定律。进入2018年,圈内出现的质疑声越来越多,比如《【AI 幽灵】超 90% 论文算法不可复现,你为何不愿公开代码?》、《这里有一篇深度强化学习劝退文》、《深度学习劝退文》。感觉世界上除了伯克利BAIR实验室的人,其他人都复现不出深度增强学习算法。

虽有质疑,但是每隔一段时间,伯克利和OpenAI都还是能拿出一些看起来效果非常惊艳的工作。不过,因此强行说DRL就能做出传统方法做不出来的东西,就有点不合适了。比如说最近OpenAI的新作像人手一样:OpenAI用打DOTA算法,教机械手“盘核桃”,如果用传统方法来做,也是能做的,总计算量也差不多:用外部摄像头计算出木块的位姿,然后根据牛顿运动定律和欧拉方程列出动力学微分方程,再解个优化问题算出连续转动的施力点,接着计算每个手指提供施力的角度和方向,然后移动每根手指(后面这几步,在我导师的书A Mathematical Introduction to Robotic Manipulation里都明确地写了该怎么做)。这些过程中要解一些非常繁琐的优化问题,但是如果能拿到OpenAI训练神经网络所用的计算量,解优化问题也不是太麻烦的事情。而且大家一说传统方法就觉得是有模型的,所以不容易扩展。但其实从物体的外形计算出合适的施力点这个过程,在传统的方法里本来就是无模型的凸优化问题(可参见 @戴泓楷 的工作),不见得比DRL的方法差到哪里去。所以现在业外人士,包括业内人士的态度都变成了:方法A做出了不错的效果,推测觉得方法B做不到,就说明方法B完全不能用,方法A是人类的未来。但是就没有人用方法B做过同样的事情啊,连对比都没有。而且OpenAI这个机械手盘核桃,读了论文发现实验中50次平均成功13次,这么低的成功率为什么能被用来证明方法A就好到是人类的未来呢……

我应该还会继续关注这个领域,但是不想也不再有机会去伯克利去弄明白这件事。17年人工智能的浪潮继续高涨,大量的申请人想挤进BAIR实验室去做深度学习,伯克利的秘书说17年的申请人数量是16年的好多倍,我放弃了offer就拿不到了。不过好在后来顺利拿到了卡内基梅隆大学的offer。

我将加入卡内基梅隆大学机器人学院的Biorobotics lab,跟随Howie Choset教授进行科研,继续沿用比较传统的机器人学家分析问题的方法和思路。非常巧合的是,前两天在Mavic 2宣传文里我谈到的给Mavic Pro颁发“年度空中救援机器人”的组织,同时也把“年度地面救援机器人”颁发给了Howie Choset教授团队做的机器蛇。https://www.zdnet.com/article/snakebot-named-ground-rescue-robot-of-the-year/ 这种机器人在狭小空间内搜索救援有非常大的优势,同时也能引出很多有价值的科研问题和方向。

基于我在工业界的背景和卡内基梅隆机器人学院紧密结合工业界的传统,未来我会继续研究可以适用于多旋翼飞行器和地面机器人的通用控制和规划技术,同时也会关注机器人系统架构的标准化工作。我希望能够通过博士期间的学习和科研工作,回答一些更大的问题:机器人应该尽量模仿生物还是超越生物?是否存在显性表现群体智能涌现的算法?真正的机器人学习是怎样的范式?我不想盲从人工智能热潮,我相信真正的人工智能、超越人类智能的智能,应该是从我们对物理世界的规律、能量转化的利用和现实世界抽象的数学中涌现出来的。

虽然卡内基梅隆的很多人已经认识我,但是就像卡内基梅隆大学博士田渊栋学长说的那样:

不要在优越感中停止自己的脚步。名利于人最可怕的莫过于此,分明刚刚启程,但欢呼声让你觉得已然冲线,本来要万里长征,却变成了百米短跑,接受完了鲜花之后,就再也看不见远处的风景。其实境界到了或是未到,只有自己知道。跋山涉水,风餐露宿,鼓掌的是别人,度化的是自己。
我需要不断让自己做好“雄关漫道真如铁,而今迈步从头越”的心理准备。也希望未来在卡内基梅隆不会得到太多科研和教育以外的关注。

对于年轻的科研工作者来说,在哪里展开科研工作的博士阶段是一个非常重要的选择,我不知道自己关于伯克利还是卡内基梅隆的选择有没有做对,多年以后回头再看也许会后悔,可能那个时候大家都已经转向了深度增强学习的研究,深度增强学习也在工业界得到了广泛的应用,但是至少最开始的时候我有一个我自己坚持的想法,没有随波逐流。

我在大疆从事的最令我自豪的工作之一——RoboMaster,之后会继续以顾问和裁判长的身份参与,帮助这项比赛走向国际。过去几年中有很多高中生、大学生在参加完RoboMaster的比赛、冬令营和夏令营之后也受到卡内基梅隆和其他一些美国大学的青睐,未来我会继续在美国帮助他们,也会给RoboMaster圈子里的同学继续提供职业发展的建议和咨询。

过去的五年,我在大疆经历了一段英雄辈出的时代,得以有幸和一些全国甚至全世界最优秀的工程师合作,并向他们学习了很多经验,没有和他们共事的经历也没有我现在能够得到的读博士的机会;同时在大疆也得到很好的平台和资源专心做机器人教育事业,通过RoboMaster机甲大师赛帮助了新一代工程师的成长,并且为他们的故事所感动,去读博士不是这项事业的结束,而是另一种形式的延续。我相信大疆创新在未来依然是中国最有竞争力的消费电子、机器人和制造业企业。公司内一些正在孕育的新技术和新项目一定会在接下来的很多年中持续刷新人们对中国制造和创新的看法。RoboMaster作为我口中的“大疆下一个创新”、被媒体描述成“大疆第二次创业”的项目,也会持续开花结果,带给人们紧张激烈的机器人比赛,也带给下一代年轻人更开阔的未来和可能性。我深深感谢过去经历的这一切,感谢合作过的每一个人,我们都会在世界各地继续努力,“聚是一团火,散是满天星”。

我也非常感谢我的妻子 @Lexi M 。在别人都已经安顿下来的年纪,还要换个生活方式继续挑战自我,这对我的家庭也是一个巨大的挑战。妻子从一开始就非常支持我去走上这条新的道路,给我出主意,并且愿意为了我调整自己的职业发展方向、经历离别和生活方式的改变。人生得一知己足矣,而对我来说我同时得到的是知己、朋友、亲人和爱人,对此感激不尽,只能用一生的努力去报答。

最后,用我非常欣赏的哈尔滨工业大学机器人队的队训作为结尾,希望在未来的几年自己能够一直被这句话所激励:

极限尤可突破,至臻亦不可止


博士第一年

博士过了第一年,顺利通过了资格考试(qualifying exam)成为了PhD candidate。在这里写写一年来的感想。

我在卡内基梅隆大学的博士生导师是隶属于机器人学院的Howie Choset教授,他是机器人学院的中年教授中比较知名的一位,因为他在医疗机器人和蛇形机器人上都有开创性的科研贡献。机器人学院下属于计算机学院,但是当我找Howie套词的时候他建议我把机械系博士也申请上。于是我最终被机器人学院拒了而是到了机械系。到了实验室以后我发现Howie的博士学生清一色都是机械系的,一个计算机系的教授带的全是机械系的博士,这非常奇怪。大家聊来聊去,发现这么一件事情:几十年前,作为计算机本科大四学生的Howie申请博士项目,被所有的计算机系都拒绝了,只被加州理工学院的机械系录取,于是他在博士期间痛苦地从计算机转行机械……

后来我发现,卡内基梅隆大学的机械系虽然纸面实力全美第十,但它的真实实力应该比这高一档。因为很多机械系做机器人研究的学生,到卡内基梅隆大学的第一目标都是机器人学院,因此耻于和其他人说自己实际隶属于机械系,所以就算跟了机械系的教授,也都在发表论文的时候说自己的工作单位是机器人学院,因此一大批机械系学生优秀的科研成果被归在了计算机学院内,导致了机械系真实实力被隐藏了。

于是我也步Howie的后尘,从本科计算机转到了博士学机械。一开始我像很多人一样也有点耻于告诉别人我是机械博士而不是机器人博士,但是其实工作在机器人学院,也能自由地选机器人学院的课,其实没什么不同,所以后来也觉得无所谓。而且成为卡内基梅隆大学全民转码大潮中的异类,这倒是也挺酷。另外我也建议大家如果想申请来机器人学院读博士,可以考虑顺便申请一下隐藏了实力的机械系。机械系做机器人方向的Aaron Johnson教授也是很强的……

前阵子在知乎回答里说到我写了两篇论文但是被Howie和实验室的另一个教授Mat Travers拒掉了,后来安心反思了一下,也觉得他们说的非常有道理。我在第一年里走了很多的弯路,主要的问题在于不会判断什么是机器人学中的科学问题。

我写的两篇未能投出去的论文中第一篇是在六足机器人Daisy上面做状态估计。

动图封面
我带着几个本科和硕士学生先用几个月时间给Daisy从头到尾写了一整套C++代码,首先从定义机器人和机器人部件的抽象类开始,把机器人分成Base基类和Leg基类,然后对于不同类型的六足机器人派生出不同的子类,有时候用了一些花式派生方法把自己都搞糊涂了。我们然后给机器人设计了不同的步态,接着整合起ETH的步态规划算法Towr给机器人生成步态。我的主要创新点是改进一个估计机器人行走时在空间中走过的距离的卡尔曼滤波器:ETH学生Michael Bloesch在2013年发表了论文State estimation for legged robots-consistent fusion of leg kinematics and imu提到了如何用IMU和机器人关节的位置信息实现这种距离估计的算法,我在他的工作的基础上做了不少改进,其中主要的一个是通过机器人关节上的力传感器,我能准确区分出一条腿是站在地面上还是在空中挥动,因此可以更准确地让机器人利用关节速度计算身体移动的速度,所以能实现更准的状态估计。在上面的动图里,机器人一边运动,一边估计自己的状态,然后用反馈控制器跟随目标轨迹以走上斜坡。和Vicon以及视觉里程计的对比都显示我的这个状态估计算法表现非常好。

然而Howie和Mat的意见是,人家已经说了怎么用卡尔曼滤波器做状态估计了,你虽然做的效果好,但还是用卡尔曼滤波器而已。而利用力传感器信息提升状态估计的精度,只是一种工程上的性能提升,不是科学研究。

我写的另一篇论文是一个能在横杆之间像猴子一样晃动的机器人:

动图封面
动图封面
这个猴子机器人是我和来自清华的机械系硕士生顾兆元一起完成的,我们选用了我之前在大疆的团队做的RoboMaster GM6020电机和开发板,顾兆元设计了一个很巧妙的身体结构,我设计了手指的连杆机构,然后在其他几个机械系同学的帮助下把机器人造了出来。然后我列出了机器人精确的动力学模型,另外还建立了一个simulink的model,然后用iLQR算法生成最优轨迹给到开发板上进行底层控制。在大疆的工程训练给我养成了一些一定要把东西做精的强迫症,于是我逼着顾兆元一起花了几个星期在matlab和RM开发板之间写了一个带ack机制和CRC32校验的协议,写得很崩溃。但是这个协议让电脑和机器人之间的蓝牙通信非常稳定。我的主要创新点是通过iLQR算法能够比较快速验证不同构型的机器人,从而帮助我们进行机器人参数的选择,另外和前人做的猴子机器人相比(现任IEEE主席、北理工的福田敏男教授是猴子机器人的先驱),我的机器人是两自由度的,而以前大家做的基本只是一个自由度的(两个胳膊中间夹一个关节,而没有中间的身体),因此我的机器人可以利用身体的晃动实现更好的动态性能。

然而Howie和Mat对猴子机器人的意见是:作为一个课程设计来说,这是phenomenal的,但是它不是research。首先通过最优控制算法验证机器人的参数是个常规操作,别人做过很多了;其次虽然我号称我的机器人有身体能够使运动更高效,但为了证明这一点我需要积累很多的对比实验数据。另外我声称真的猴子是有身体的,所以我的机器人有身体肯定要比前人那些没身体的机器人更好。这一点如果不是和真实的动物实验数据做对比,说出来是难以令人信服的。然而我们不可能在机器人学院养猴子,所以获得动物实验数据非常困难。

所以总结来说,在我的两项工作中,我都是把已经被人解决过的问题拿出来重新解决一遍,然后用我比较强的工程能力去提升机器人的性能,最后呈现的结果虽然比较好,但是这种结果的产生不是来自于新的科学思想。我尚未知道作为博士生,在机器人领域,应该如何定义新的科学思想,但是我们确定的是我并没有在这两个机器人的制造和开发过程中产生新的科学思想,因此这两篇论文都很难投出去,明年去ICRA又只能打酱油了。

今天是机器人学院成立四十周年的纪念日,机器人学院准备了一整天的各种活动,其中的重头戏是下午的历任院长演讲环节。

机器人学院的院长们人才济济。Raj Reddy是计算机语音识别领域的专家,图灵奖获得者,也是著名华人科学家和企业家李开复和沈向洋的导师;Takeo Kanade和学生发明了计算机视觉最基础的光流算法;Matt Mason是机器人抓取领域的先驱人物;Martial Herbert 领导了很多卡内基梅隆大学的自动驾驶项目。他们都是能在机器人发展历史上留名的人物。院长们回顾了四十年来机器人学院的发展历程,听来让人深深为他们挥斥方遒的气度折服。

我不禁回想起去年在华南理工大学参加的一个活动。华南理工大学机器人队的张东教授组织了一个机器人大赛高校交流会,期间请到了他的老师谢存禧做演讲。谢老师是中国最早做机器人的学者,他在国家机器人攻关项目及国家863计划中的多个项目中都是主要领导人。但是谢老师当年的工作并没有留下过多的记录,他只能列出一些人名,然后口头回忆当年的奋斗岁月。在座的听众并看不到什么生动的机器人视频或者照片,有些学生纷纷打起了哈欠,让人看起来有点心酸。

而机器人学院的教授们不仅有那个年代的记忆,也有关于那个年代翔实的影视资料和实物。Raj教授列出了机器人学院成立时的教授名单

也展示了他们当年造的机器人视频

Takeo教授更是有媒体的采访,介绍他2001年为超级碗橄榄球赛设计的一套计算机视觉系统:

机器人学院最早的机器人项目CMU Direct Drive Arm历经三十年没有被拆掉,被安置在了学院4楼的走廊处作为展品。而我们还能随便在办公室里翻到三十年前学院申请经费的报告。1986年,正好也是我国863计划开始的时候。

两相对比,让我不禁觉得我国的机器人事业发展还有很长的路要走。

机器人学院的四十周年纪念活动让我感觉我们当代的机器人学家不仅应该创造知识,也应该做好历史知识的传承者。同时我也觉得很惭愧,来机器人学院一年,在科研上还没有摸到门道,实在有愧前辈们创造的良好环境。希望再过四十年,后辈们问起我的工作,我也能自豪地告诉他们,我不仅吸收了那些关于久远的冰冷机器人的温暖记忆,也创造了新的机器人科学知识。未来要更加努力呀。


博士第三年

我在大学的时候就是一个好为人师的人,这个缺点被历代前女友和老婆都批评过,然而我并改不了。因为回想大学的时候我经常会因为“如果我要做这种机器人技术我该上什么课”而困扰并且走弯路,当时就十分期望如果能有一些有水平有经验的人多写出来一些文章能指导我多好。数学和计算机方面,好的文章是很多的,比如吴军博士的《数学之美》和林达华的《MIT大神解说数学体系》都给我很大启发和影响。但是机器人方面,就没什么好的学习资料和指导,那个时候如果有好为人师的人能给我一些指导,我觉得我也会很受益。因此每等我自己学到一些东西有一些想法以后,我就会尽快把他们写出来以帮助之后有兴趣的其他同学。很多我会的东西在行家看来肯定十分粗浅,但如果能帮助到哪怕一两个对机器人有兴趣的朋友,我也觉得很值得。所以每年写个文章记录一下自己的博士的过程也是相同的目的,把过程中的收获心得写下来给自己也给知乎的读者们看,是反思也是对其他人的帮助。而且在毕业前写这样的记录价值是比毕业以后再回顾写更大的,因为谁知道过两年是不是就读不下去退学了呢……处在未来不确定的状态下来回忆这些事情更加真实。

博士第二年是2019年9月到2020年9月,过得很痛苦,长期处在“明年坚持不下去要不就退学吧”的心理状态中,也经历了很多情绪上的过山车,并没有心情写总结。第三年是2020年9月到2021年9月,经过长期的痛苦探索以后终于在选择科研方向的问题上有了一些曙光,有了不少可以分享的心得。

第二年做了挺多东西。2019年下半年跟着Aaron Johnson(CMU机械系教授)系统地学习dynamics建模,看Mat Kelly(波士顿动力公司工程师)的direct collocation工具包,复现了Michael Posa(UPenn电子系教授)的contact-implicit optimization,所以2019年用了一整年才把非线性优化的两大方向(direct collocation和DDP)入了门。2020年开始决定自己复现Alexander Winkler(ETH博士)的足式机器人轨迹规划工具towr,于是花了三个月时间把towr重新实现了一下,增加了一些自己的技巧。同时因为在上一门讲优化的课,所以仔细看了numerical optimization这本书,尤其是把Lagrange multiplier的原理和KKT condition的推导过了一遍。在这个复现过程中熟练掌握了C++和Matlab进行非线性优化的各种细节,尤其是C++中调用IPOPT、SNOPT做非线性优化还有使用Casadi生成系统动力学方程的方法,最后能够通过非线性优化给六足机器人生成运动轨迹,同时优化脚触地的时间点,一直做到9月份,我的六足机器人能够踉踉跄跄爬上楼梯。

动图封面
这已经差不多两年过去了。 这期间狂写代码,做了一些看起来不错的机器人和算法,然而没有发任何的论文,因为我的导师Howie和M还是觉得迄今为止我做的东西都是在别人的工作上小修小改,并没有本质性的创新,也不让我写论文。作为学术界大佬,Howie一向都是让学生自己去探索研究方向,不过自从前几年大弟子龚超慧做蛇形机器人的工作发了Nature和Science以后,Howie对待学术的标准大大提高,对ICRA这种水平的会议都已经不怎么重视了。

作为一个第二年结束还没任何论文发表的博士,焦虑自然是焦虑的,但是还是在想办法给自己打气。一方面来说,这两年我的编程水平和在机器人学上的知识积累都提高了不少,常常感觉大疆时期的我有点坐井观天,回想以前工作中一些碰到过但是不会解决的工程问题,现在很有把握再碰到是能够把它们解决好的,再看自己以前写的那篇《机器人工程师学习计划》也觉得有很多可改进的地方。另一方面来说,实验室的二师兄言传身教给了我不少鼓励。二师兄是现役美军中校,在西点军校本科和研究生毕业之后在陆军服役多年,四年前和军队说想要到CMU读博士,然后去西点军校教书。二师兄热心教学,常常指点实验室的同学们。“西点军校”这个名震天下的地方我只在小时候读到的鸡汤故事里听过,然而现在博士资格考试都得到了西点军校的军官的指点,感觉非常奇幻。二师兄到了CMU以后,前两年也毫无可发表的成果,直到第二年暑假结束才投了第一篇paper,他通过poincare map给双足机器人构造了一个dynamical system,用这个dynamical system做为constraint用SLQ做多步行走的轨迹优化,思路和实现都很精妙。这个工作水平很高,让他第三年就毕业了,得以顺利在2020年的暑假就回西点军校做教授。所以学术这个事情,马虎不得,需要一点一滴做起,铺垫两年是正常的。

虽然有老婆的支持和自己给自己打气,2020年整个上半年在学术上我都感觉自己孤立无援。随着新冠在美国的爆发,学校关门,我只能把机器人搬回家测试,或者晚上偷偷去学校。我们实验室的六足机器人性能很差,它最早只是一个验证机,电机的硬件没有针对足式机器人的应用做太多优化,也不能做精确的力反馈控制。于此同时,Google在宇树科技的机器人Laikago上做的行走工作拿了机器人领域的顶会RSS的最佳论文,ETH又有一篇关于足式机器人深度学习的工作登上了Science,让人深感焦虑。我和Howie和M抱怨机器人硬件不好,而且全实验室上下除了我以外只有顾兆元一个人帮我做,有太多代码工作需要做。我和Howie说起来这些相关工作的时候,“人家ETH和MIT都是一组十几个人在做一个机器人的不同部分,分工合作的”,我这么说。而Howie觉得我在找借口。

另外M的态度让我很抓狂,他会在某一次周会里说“我觉得让这个机器人爬楼梯,用XXXX的方法一天也就写好了”,或者在下一次周会里说“你应该不要做机器人而多做做理论工作”,但是当我提出一些理论性的想法以后他又会突然问“你的机器人怎么还不能爬楼梯”。另外他还会大量使用俚语和比喻导致我怀疑我的英语不能和人正常交流,比如他说我们要跟随前人的工作,他会说“we are not trailblazer, we just follow the cool kids.”新冠疫情导致开会只能远程开,很多时候无法揣测对方说某些话是出于什么样的目的,因此这些没有意义的反馈让我精神压力很大,对我的自信心的碾压也很厉害。2020年暑假中有几次会议M都在说觉得我再这样下去博士毕业都难,而我不知道我自己现在究竟是怎样的。我,作为一个以前曾经接受过Time,Bloomberg,The Verge等国际媒体采访的人,和Elon Musk的传记作者Ashlee Vance谈笑风生的人,现在会在开会前诚惶诚恐,接着因为不理解导师想让我干什么而夜不能寐,同时在调试机器人的时候因为机器人的翻倒而感到加倍的焦虑。

到2020年的8月我实在受不了了。在整个暑假里我顶着M带给我的压力自己学习不同优化算法,复现了一些带约束的LQR算法。这期间我了解到带约束的LQR问题一直是个难点,并且产生了把有约束的LQR和SLAM领域的图优化联系在一起的想法。Georgia Tech的Frank Dellaert教授是SLAM图优化领域的奠基人之一,他的学生也在这个方向做了一些工作,我去找他和他的学生聊这个想法,他们都觉得很有价值,值得合作。能得到学术界的泰斗人物的认可,我感到很开心。但是我回头和自己的导师说这个想法的时候却被M斥责了一顿,然后又问“机器人怎么还不能爬楼梯”。这盆冷水让我几天缓不过来情绪,找不同的朋友聊天,思考人生和学术的意义。最后我和Howie说我觉得M并不合适做我的导师,我们讨论了几次之后Howie表示尊重我的意见,不再让M参加我们的会议,允许我自己再找一个导师。

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Go语言工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Go语言全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
img
img
img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Golang知识点,真正体系化!

由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新

如果你觉得这些内容对你有帮助,可以添加V获取:vip1024b (备注Go)
img

一个人可以走的很快,但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新**

如果你觉得这些内容对你有帮助,可以添加V获取:vip1024b (备注Go)
[外链图片转存中…(img-5IK1l1nz-1713015344048)]

一个人可以走的很快,但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值