专访探索AGI的孤勇者,传奇工程师John Carmack

10c270755d97efc221942dcab7e32ecb.png

要点摘录

  • 我坚信,实现AGI程序的源代码,一个人就能编写,规模是几万行。而不是Chrome三千万或者Twitter两千万那种量级。推理是:人的DNA信息量不到1GB,而大脑只有40MB,其中还有冗余和不精密的部分。十年内我们也能拥有匹配的硬件完成这项工作。

  • 职业生涯早期,当我有个聪明的想法却没成功时,会非常沮丧。但现在,我已经很擅长把自己的新奇念头打倒——想办法摧毁它们,而不是当成宝贝来呵护。

  • 我是个重细节的人,即使是谈火箭,目标也不会说成“殖民火星”,而会讲讲怎么用螺栓把零件固定在一起。

  • 所以,创造更多“人力”,应用在日常事务中,例如告诉AI,你想制作一部电影或漫画书,就能直接在云上运行——这就是我对AGI的愿景。

  • 现在世界有80亿人,比5千万人口生活在山洞时好得多。随着AI进入社会,将大大提升社会价值与进步总和。AI会极大地影响经济。我觉得AGI实现的可能性到2030年会提升到60%。往后说,2050年会有95%。

  • Sam Altman、Greg Brockman、Ilya Sutskever曾经精心策划过一次研讨活动,目的是想劝我加入OpenAI。Ilya给了我一份大约40篇研究论文的清单,说“如果你把这些都学会了,就会明白90%的重要工作了。”我照做了,一切都开始在我的脑海中变得清晰。

  • 令人惊讶的是,“主力选手们”都在进行“集体思考”:去年OpenAI发布了一个图像生成器,然后Google、Facebook跟着纷纷发布——不同公司的精英们在做同样的事,在有限的空间“交叉授粉”。

  • 机器学习有个策略:你需要一定随机性,我把自己视为为随机点。我的背景和大家不同,之前并不做学术研究,而是一名系统工程师,但有足够的能力掌握必要知识。其他人朝着他们认为美好的未来前进,保持像我这样的随机性也重要。所以我选择单干。

  • 同样令人惊讶的是,每个人都把DeepMind和OpenAI视为领先的AGI实验室,却看不到像我这样做事的人。

  • 我很幸运,曾经获得过成功,财务稳定,所以我赌得起,能花十年冒这个险,不用担心自己破产。如果我有百分之几的成功概率,而赌注的那一边价值数万亿,从这个角度看,赌局并不糟糕。

  • 在AGI问题上,我和其他人成功的几率差不多,虽然有些人筹集了数十亿美元,并且在某些问题上卓有成效,但还说不清它们是否是AGI的必经之路。

  • 我曾经的合作伙伴,建议我如何如何做,保证能成市场独角兽。但我认为这是一项长达10年的任务,为此筹集的2000万美元,我不想在接下来的两年内烧完,然后再融资——这不是我做事的方式。

  • 商业成功很诱人,但这分散了每个人的注意力,无法放眼未来。关于我的工作,可以直率地说——近期商业机会为零。

  • 虽然有人投资了2000万,但我没承诺取得AGI突破。相反我说的是:我这里有个不可忽视的机会,为了抓住它,我会亲自弄清楚。

  • 我觉得自己有一定概率,比OpenAI、DeepMind以及所有的中国实验室更早想出可行的办法,但不会自大地说会第一个成功。

    (以上文字做了不改变原意的编辑)


46845905978a72d29c594c1993e45c86.png

人物简介:John Carmack,游戏开发公司id Software的创始人,他以极强的编程和工程能力而知名,代表作《毁灭战士》(Doom)和《雷神之锤》(Quake)等。他还创立了美国犰狳航空航天公司(Armadillo Aerospace),并曾担任虚拟现实公司Oculus的首席技术官,后又加入Meta。2022年12月,卡马克辞去了Meta虚拟现实部门的领导职务,全身心投入AGI研发。

在近期《Dallas Innovates》的专访中,他深入介绍了自己在达拉斯隐居的方式工作的方式和原因。智源社区对访谈内容进行了编译。

另起炉灶,追寻AGI的圣杯

另起炉灶,追寻AGI的圣杯

AGI是人工智能的圣杯,这位达拉斯最著名的科技奇才对AGI的追求就好比是百年难遇的登月行动。在这场针对AGI的角逐当中,参与方还有来自科学家、学者和大型科技公司的“群体思维”(groupthink)的独立竞争,他们也在积极寻求解决方案。

今年8月,Carmack宣布,他的 AGI 初创公司Keen Technologies在新一轮融资中从多个知名投资者手中筹集了2000万美元。这一轮的参与者包括前 GitHub CEO Nat Friedman、Cue 联合创始人Daniel Gross、Shopify 创始人Tobias Lutke、Stripe 联合创始人Patrick Collison、红杉资本以及总部位于奥斯汀的 Capital Factory。

Carmack强调,尽管他本可以自己开一张2000万美元的支票,但从投资者手中拿到融资,将迫使他在寻求 AGI 的答案时更加自律和坚定。在贝弗利的房子里,Carmack主要忙于Keen Technologies相关的工作,他称之为职业生涯的“第四个主要阶段”。在此前一个阶段,主要是参与id Software 公司在电脑和先锋视频游戏方面的工作,有过短暂的经历,如发布于1991年的《雷神之锤》(Quake)和《毁灭战士》(Doom) 系列游戏,在美国犰狳航空航天公司火箭研发的工作(2000-2013),以及在Oculus公司研发虚拟现实,后者在2014年被Facebook(现更名为Meta)以20亿美元收购。2019年底,卡马克从 Oculus 的首席技术官职位上退下来,成为 VR venture的顾问首席技术官,并宣布他将专注于 AGI研究。但去年12月,他从Meta辞职,专心致志于在Keen的工作。

12644f9de76976b873264c0c46bfcdc3.png2005年在洛杉矶举行的《毁灭战士》(Doom) 发布会上,Carmack与当时的id Software首席执行官Todd Hollenshead、 以及id 的Kevin Cloud和Tim wilits在一起。

加速器和风投公司Capital Factory 总裁兼联合创始人Bryan Chambers表示,自2019年Carmack宣布对 AGI 感兴趣以来,这家公司一直在积极跟踪他的消息。Chambers说: “当一个标志性的技术专家带来这样的机会时,射门才是最重要的ーー你需要射门得分,因为这样的机会百年不遇。“Chambers表示,对Carmack这样的创始人进行“登月”式的投资押注,是资本工厂的一项重要战略。Chambers称Carmack是“我们这个时代最伟大、最重要的思想家之一”。正是这些与众不同的奇才往往能够在创新过程的任何阶段创造出非凡的价值。

此外,Chambers表示: “在实现AGI的过程中,任何进展都将改变一切。”、“它将推动其他人的尝试,推动整个人工智能社区。如果AGI真的实现了,那么我们将享受参与人类历史上最重要的价值创造公司之一。这也是风险所在。”这家创业公司之所以名叫Keen,也是来源于Carmack的第一个视频游戏——指挥官基恩系列 (Commander Keen)。同时Carmack还聘请了达拉斯地区的工程师Gloria Kennickell和他的哥哥Peter Carmack,后者是堪萨斯城的首席财务官(今年可能会再招聘一到两名员工)。

和马斯克旧相识

在家中楼上的一间办公室里,Carmack 把工作重心放在了 Keen这家公司上,办公桌上放着一个黄色的笔记本,上面写满了笔记,旁边是一台传统的台式电脑,主要用于“调试”开发工作。“当我测试模型时,需要在一个更大的系统上,或者在云资源上运行它,”Carmack 说。

8adfa130ea19ca5200ce35410881b1e4.png84441053ef1161c2d5fa17c8dee3ac75.png

Carmack的工作环境

“随着我们开始进行更大规模的工作,我将派人管理另一家远程供应商设置的一个中等规模的集群。”漫步在这个大房子的其他地方,Carmack随手指着一顶挂在墙上的牛仔草帽,草帽来自南德克萨斯州Elon Musk的星际基地,是Musk的一个“手下”送给他的礼物。

8830b20949870e73bc16aa95fcbcffcc.png

来自马斯克手下的礼物——牛仔草帽

Carmack表示,在Musk创办SpaceX以来,他们就已经相识了。那时Carmack的美国犰狳航空航天公司(Armadillo Aerospace)也刚刚起步。Carmack说: “有一次,Musk和他的首席推进器工程师来到我在加兰德的小店,我们多年来一直保持着联系。”。“当他离开加州的时候,我还匆忙找了一些人去游说他,‘嘿,你真应该搬到达拉斯去,’我们确实努力劝了他一阵子。”

Carmack在堪萨斯城长大,上世纪90年代初搬到了德克萨斯州北部,他长期以来一直十分支持这个“孤星之州”,尤其是达拉斯。“一旦我们进入德克萨斯州,我真的很喜欢这里,”他说。“我对很多以商业为重心的事情感到放心。”他补充称,Musk教会了他一个宝贵的经验,全身心投入自己的事业非常重要。此前,由于犰狳航空航天公司未能发展成功,卡马克不得已关闭了这家公司。

他表示:“当时我一边还在从事软件开发,一边在跟踪航空公司那边的事情,导致精力不是很集中。”“我从Musk身上学到的一点是,他总是对自己做的事情全力以赴。其实我为我们在犰狳航空公司完成的许多工作感到自豪ーー比如 SpaceX 最终完成的垂直着陆ーー但问题是我那时候不够专注,很明显现在对于Keen公司我是全力以赴的。”

为了激发创新思维,他说,他每天要步行至少四英里(听着有声读物),大量阅读 Kindle 上的材料,经常把书籍和杂志从天花板高的图书架上拿下来。他说,自从青少年时期以来,他读过的大部分书都还在,因为“我无法忍受丢弃印刷材料。”房子里许多书架上的书的主题范围很广,从《发电厂工程师指南》、《 Java 安全》、《千脑智能》、《象棋赢家》和《太空先锋》到《凯文的幻虎世界》和《远端画廊》。

“从这个角度来看,创造力通常是把这一点和那一点联系起来。我家里的所有这些书都是来给我提供信息的,而这些信息往往就隐藏在我大脑记忆的影子和暗示之中。”Carmack说,“大多数真正好的想法都来自于这样一句话: 好吧,我现在正在解决这个问题,这让我联想到了其他一些事情。然后一连串的回忆将所有这一切都勾勒了出来,直到出现这样的情况,‘哦,这真是个好主意,这个灵光乍现可能真的很棒。’然后我迅速追踪这些线索,并问自己一个问题,如何才能迅速测试它呢?”

The Q&A

以下为这位科技奇才专访实录(为了简洁明了,笔者对问答进行了编辑)。

Q:你现在正在用什么样的工作方式来“解决”通用人工智能(AGI),为什么要采用你的特定方式?

A:我一直坐在我的电脑前,思考概念,记录想法,制定理论,然后进行测试。这就是我现在的工作,因为没有人真正知道抵达最终目标的完整路径。但我认为,我和其他人能成功解决AGI的几率差不多。有些人筹集了数十亿美元追求AGI。有迹象表明非常强大的东西现在在狭义的机器学习中是可能实现的,目前尚不清楚这些是否是实现人工通用的必要步骤。对于乐于这样做的公司来说,这是一个不错的选择,有很多不同的出口,即使你没有一路走下去抵达终点,过程里也有很多有价值的东西,会改变世界,比如狭义人工智能(narrow AI)。

但令人担心的是,如果你只是走出第一个出口就说,‘嘿,这里有一个价值数十亿美元的出口’——我们知道,只需利用我们所已知的一切就可以彻底改变各个行业。这是一件非常诱人的事情,但它分散了每个人的注意力,使他们无法放眼未来,无法专注于远距离的事情。所以,我可以直截了当地说,目前我在做的事情:短期商业机会为零。


Q:是什么促使您对AGI这个话题产生兴趣?

A:我们现在正处于一场科学革命之中,因为 10 年前,人工智能还不太有效。我们经历过这些人工智能“寒冬”——事实上,在过去的几十年里就有好几次。这很有趣,因为虚拟现实也经历过这个阶段:虚拟现实几乎成为了一个坏词,因为它在 1990 年代变得如此糟糕,人们甚至不想谈论它。

c2dd7902b47c5a88e22a187236267615.png

人工智能有几个这样的恶性循环:炒作升温,资金流入,表现不佳,然后崩溃,没有人愿意谈论它。但是最近十年不同了,原来没注意到的人都开始纷纷注目,因为在过去十年中机器学习出现了多项让人震惊的突破,意义深远。这才是真正促使我说,“可能真的是时候认真看看这个了。”这对我来说很有趣,因为我对于机器学习和 AI 的理解尚处于一个技术旁观者的阶段,从十几岁开始读过一些开创性的领域书籍,了解到符号AI一类的概念。

所以,我的大脑对这些事情有所了解,但我并没有真正关注AI领域,因为我正忙于游戏开发、航空航天和虚拟现实等方面的工作。如今我才意识到,“好吧,我想这里可能有一些事情我需要弄清楚——什么是炒作,什么是现实?”所以我做了我通常在做的事:我所有的真正能力都是来源于从本质上理解事物,只有从最底层,最深层次上了解事情是如何发生的,你才能获得洞察力。

所以,大约四年前,我进行了一次为期一周的静修,在那里我只带了一台电脑和一堆参考资料,我花了一周的时间重现这个行业的基本原理,达到了我自认为已经非常了解AI的程度,以至于可以与研究人员就此进行认真的对话。当时我对达到那种理解水平感到非常兴奋。

在那之后,OpenAI 的 Sam Altman 邀请我参加一个会议——Y Combinator YC 120——虽然以前我从来没有参加过这类会议(因为我有当隐士的倾向),但这次我决定参加。事实证明,这真的是 Sam 精心策划的一次活动,因为他找来 OpenAI 的 Greg Brockman 和 Ilya Sutskever 来劝说我去 OpenAI工作。

我对此感到非常荣幸,因为我无论如何都称不上是机器学习专家。可以说,我是很多知名系统的工程师,但对于AI,我只有最基本的基础知识。所以,他们才是该领域的领导者,他们对我的肯定种下了种子,让我思考AI领域正在发生的一切的重要性以及我在其中可以扮演什么样的角色。

所以我向OpenAI首席科学家Ilya Sutskever要了一份阅读清单。这就是我做事的方式:我需要了解这个领域的所有东西,才能真正从事相关工作。他给了我一份大约 40 篇研究论文的清单,并说,“如果你把这些都学会了,你就会明白现在 90% 的重要工作了。”我确实仔细研究了一番,这一切都开始在我的脑海中变得清晰。

bf17ee04769aa7cd0e5dc2d87f2f9783.png


Q:你当时还在 Meta 从事虚拟现实吧?

A:是的,我在 Meta 遇到了一些关于大规模战略方向的实际问题。我相信你已经看到了一些关于他们花了多少钱的头条新闻,而且我认为大部分钱花得很不值。从收购 Oculus 开始,我在那里的工作遭遇到了一些挑战,同时我的五年合同也即将到期。

于是我决定要更加认真地对待AGI这项工作。我以前在游戏、火箭、虚拟现实中做过的所有事情,我的目标都是从无到有,实现一些原先没有的事情,但我总是有一个清晰的规划。但是,对于 AGI 来说就不同了,因为没有人知道如何去做。这不是一个简单的工程问题。

过去十年中发生的事情,存在各种各样诱人的线索,事实上都是一些相对简单的想法和技术,并不是多么艰深的黑魔法巫术。距离实现和我们人类相仿佛的生物智能体,可能只需要六七个量级的洞察线索了。我在三四年前曾做出估计,我们有50%的几率在 2030 年在通用人工智能身上看到明显的生命迹象。

这并不一定意味着会产生巨大的经济影响,只是证明,我们有一种在计算机上运行的存在,大多数人认为它是智能和有意识的,并且与我们人类正在做的事情处于同一水平。经过三年的核心研究,我并没有改变我的这一预测。

事实上这种AGI实现的可能性到2030年甚至会提升到60%。甚至往后说,2050年,会有95%的可能性。许多人甚至觉得AGI出现会带来经天纬地的巨变,而我尽量不使用过于夸张宏大的说辞,因为我是一个注重细节的人。即使是造火箭,我的目标也不是要殖民火星,而是在谈论我用哪些螺栓将东西固定在一起。所以,我不想做一个 TED 演讲,不停地谈论所有通过看似具有成本效益的AGI能实现的所有事情。

新冠疫情表明,通过计算机交互流可以严格地完成比人们想象的更多的事情,在那里你可以通过 Zoom、电子邮件、Discord 等计算机模式进行交流。当今世界价值的很大一部分都可以以此为基础。如果有一个行为像人类的AI智能体——即使在我们今天这个由deepfake、聊天机器人和语音合成的狭义AI世界当中——很明显,我们可以通过它来模拟人类的各种形态。

我们还没有拥有具有可学习意识流的AI同事,但我们确实拥有能实现它的高深而庞大的知识量。你会发现有人会狂热地谈论剧变发生的奇点以及 AGI 将如何改变一切。

如果 10 年后,我们有“通用远程员工”,它们是将是会在云端运行的AGI。人们只需拨通电话说,“我今天想要 5 个 Franks 和 10 个Amys,我们会将它们部署到现实的工作当中,‘你可以像云访问计算资源一样启动这些AI,云访问这种AI人力资源也许是能想到的最平淡无奇的一个AGI的使用方式。

如果我们所做的只是创造更多的人力资本并将其应用于我们今天已经在做的事情,可以说,‘我想制作一部电影或漫画书,给我一个能实现的团队,’然后直接在云上运行它——这就是我的愿景。


Q:为什么实现一个能够执行人类可以完成的任务的系统如此重要?用人类来执行任务有什么问题?

A:嗯,你可以把它与很多问题联系起来,比如,“人口是一件好事吗?”“移民是一件好事吗? 我们似乎已经能够利用愿意从事经济活动并受市场引导的新的人类来源,现在世界上有 80 亿人口,比以前有 5000 万人生活在山洞之类的地方要好得多。因此,我相信,随着人工智能进入我们的人类社区参与工作,将大大提升人类的价值与进步的总和。我认为所有这些都会创造巨大的价值。


Q:您如何看待实现 AGI 的具体路径?

A:有一条路径是从今天的虚拟助手出发——Siris、Alexas 和谷歌助手——到变得越来越有帮助、能够接管越来越多的任务。但这些呈现出的功能都是脆弱的、专门的——各种知识表示、语音合成、语音理解——但这可能不是通向可灵活用于多种任务的通用智能的途径。

从字面上看,各家公司里面有成千上万的程序员,现在正致力于给这些助手增加功能,这在短期内是有价值的。将这些东西拼接在一起的编程工作属于一次性编程(throw-away programming)。但是这条路并不能帮助人们实现可以学习人类任务的通用智能体。感知相关的事情——包括理解某人的声音,甚至自然地合成声音——这些是 10 或 15 年前计算机根本做不好的。

一个上世纪 90 年代的笑话是,你有一台可以轻松击败国际象棋世界冠军的电脑,但一台电脑做不到 2 岁孩子能做的事情:因为它分不清猫狗。那时世界上还没有一款计算机产品可以做到这些简单而琐碎的感知事情。事实证明,这就是我们的大脑实际上在做的:它更多地与感知和模式匹配有关。当时人们一度认为背后是哲学符号的操纵,这有点强词夺理。几十年来,这一理论(哲学符号)导致AI误入歧途。所有这些死胡同前途渺茫,没有太大的商业价值,证明了不是AI运作的正确方式。但最近十年发生了革命:通过深度学习和深度联结主义方法,我们实际上可以做到 2 岁儿童在感知方面可以做的所有事情。在许多方面,AI已经达到了超人的水平。目前还没有实现的部分是意识、联想记忆,那些有关生活、目标和计划的东西。

也有些脆弱的人工智能系统可以实现其中一个,但这仍然不是人脑甚至动物大脑的工作方式。甚至别说人脑了,我们甚至没有可以像老鼠或猫一样行动的东西。但感觉上我们距离这些目标仿佛咫尺之遥。我认为,几乎可以肯定的是,在过去十年中开发出的深度学习工具——能够用于通用人工智能的实现。如强化学习、监督学习、无监督学习等的其他领域也还有很多结构性知识有待理解。所有这些都以人类思考事物的方式汇集在一起,我们还没有对所有这些理论进行最终综合。


Q:是否有实现AGI的关键因素或中心思想?

A:AGI的源代码,即通用人工智能所必需的计算机编程,将有几万行代码。现在,一个大程序有数百万行代码——Chrome 浏览器大约有 2000 到 3000 万行代码。Elon 最近提到 Twitter 在大约 2000 万行 Scala 代码文件上运行。这些都是大程序,一个人不可能去重写一遍。可能往后余生用来写那些代码都不足够。

但我坚信,真正支持 AGI 的代码将是一个人可以编写的东西。现在有经验的投资者认为,AGI的代码需要由一组研究人员完成,是由所有人撰写的代码拼凑而成的。但我对此的推理是:如果你拿走你整个人的DNA,其实信息量不到 1 GB。因此,即使是你的整个人体也没有那么多的指令,而且大脑就是它的一小部分——大约 40 兆字节,而且它并非严格编码的。

于是我们有了人类存在的证据:造就我们的大脑、造就我们的智慧的,并不是那么多代码。现在,它演变成一个非常复杂的物体,人脑有大约 860 亿个神经元,它们之间可能有多达 100 万亿个连接。这对于即使是计算机来讲,也是一个很大的数字。当我们谈论GPT-3一类的大模型时,会说,“哦,它有 1600 亿个参数”——这些参数有点类似于大脑中的连接。你可能会说,在我们的计算机拥有与大脑一样强大的能力之前,我们还有很长的路要走。但我认为,我们也有充分的理由相信,这个想法极其悲观,我们要走的路并没有那么长。这是因为我们的大脑其实做了很多并不是那么重要的事情。它们真的很马虎,它们真的很慢,所以它们可能不需要那么多参数。

但我想要再说一下,大脑是一个被大规模利用的简单程序,这也正是当下人工智能身上正在发生的事情。拿人们谈论的东西来说,比如GPT-3、Imagen、AlphaFold,它们框架中的源代码并不大。只有几千行代码,甚至都没到几万行。它们建立在一个支持生态系统的大框架之上,但核心逻辑并不是一个大程序。

因此,我坚信,我们在十年之内就能拥有足够的硬件来完成这项工作,代码的数量会不多也不少,也有足够多的人来参与。每个人都将 DeepMind 和 OpenAI 视为领先的 AGI 研究实验室,但让我感到惊讶的是,和我身处同样高位的人里面并没有太多人在做这件事。


Q:你为什么想要孤身奋战?

A:我之所以坚持单干,就是因为所有的主要参与者都在进行这种非常令人惊讶的“集体思考”。去年发生的这些事情让我觉得很奇怪:OpenAI 发布了一个图像生成器,然后谷歌、Facebook也纷纷发布。也就是说,这些公司可以在几个月内复制其他人的工作,因为它们都来自同一群研究人员。来自不同公司的智囊团们都在做一件同样的事情。

但是,我们其实还不知道未来的方向在哪。在机器学习领域里有一个策略:你需要一定程度的随机性。也就是说,你从随机权重和随机位置开始,有时还有多个集成模型。正因如此,我把自己定位为这些随机测试点之一。其他行业正在朝着美好的未来前进,他们在这方面做得很好。但是,因为我们并不知道那个方向是否是正确的,所以保持像我这样的随机性也很重要。

而且,我的背景和大家不同。我之前没有在做学术研究,而是一名系统工程师。我有一些与此相关的想法和系统,而且我很聪明,能够学习必要的东西。因此,虽然有人向我的公司投资了 2000 万美元,但我并没有告诉他们我可能会在通用人工智能方面取得突破。相反,我说的是我手握着一个不可忽视的机会,而为了把握住它,我会亲自弄清楚一些重要的事情。


Q:一旦弄清楚,你认为后果会是什么?

A:通用人工智能的出现可能会影响经济,这确实是一个“足以改变世界”的事情,因为它几乎可以重塑人类所能做的一切。这几乎是人类所能想象的极限。所以,做一些赌注是值得的,比如投资者为我的研究方向所花的 2000 万美元。这个方向或许可行,又或许不可行。我可以直截了当地这样讲。但是我认为,更有可能的是我会比 OpenAI 、 DeepMind 以及所有的中国实验室里的研究人员更早想出一个可行的办法。但我并不会说“是的,我有信心我会第一个成功”,因为这样过于狂妄自大。

但是,在研究这些问题的人里,我应该是最聪明的那个。我认为,在这场比赛里我的实力绰绰有余。而我正在走一条与众不同的路。我现在可以说,“是的,我将把我生命中的下一个十年投入到这个项目中,这可能会取得巨大的成功。”或者,我可能会找到两件超级聪明的事情,然后我和别人合伙一起做。这样的话也许会涉及到收购或其他。

但是我不想做的一件事是,在选择做商业APP的时候,草率地说“我熟悉游戏,也了解图像生成,那我就去做游戏内容创作吧”事实上,我在 Oculus 的前合伙人 Brendan Iribe 也跟我讲过,“来和我一起做吧。我们将筹集到一大笔钱,这会很棒的。’是的,当时Oculus势必要成为独角兽了。毫无疑问,我们可以创立一家价值 10 亿美元的公司。但更大的目标,通用人工智能,则代表着数万亿美元的生意,这两件事根本不可能同日而语。

能够来到现在这个位置,并取得成功,获得成就,实现财务稳定,我感觉自己很幸运。所以我能够赌这一把,冒这个风险,哪怕风险极大。正是因为我不担心破产的问题,所以我可以说,“好吧,如果我认为我有机会能做这件事,而且它价值数万亿,那这个选择还不错。”我的意思是,对于大多数人来说,这是一种糟糕的思考方式,但在我看来,这并不是一件坏事。


Q:您现在打算如何在 Keen 下这个“赌注”?

A:通过研究和开发我那些非主流的想法。大部分的主流做法我都会关注,因为它们很棒,很有用。现在我正在跟进去年的一些研究论文,我认为,跟原作者相比,我能把它们用得更好。

其实之前就发生过一些有价值的事情,但人们不一定知道。我真心觉得70 年代、80 年代和 90 年代的一些作品可能很有趣,因为当时发生的很多事情之所以没能成功,只是因为规模不够大。他们试图在 1 兆赫兹的计算机而不是 GPU 集群上做这件事。

我提到的这种群体思维其实很明显。如果你细看一下,你就会发现所有这些杰出的研究人员都有相似的背景,而且他们都朝着同一个方向努力。所以,我认为这些旧东西里可能会有有用的信息。现在,我正在做实验,也正在测试,试图将这些不同的领域结合在一起,因为我认为这些领域是 AGI 算法的一部分。

但我所做的大部分工作是通过看大量电视和玩各种视频游戏来进行模拟。“这就是你感知和内化世界的模型,这是你在其中一些情况下如何和代理一起行动,”但这两者是如何结合在一起的,我依然不是很清楚。但我认为总有解决的办法。我想我已经知道了有哪些问题需要解决,以及如何解决它们。

我仍然认为,我们还需要很多不同的想法,但我有一些看似合理的见解可能会被证明是相关的。几十年前,我曾这样训练过自己,就是把想法拿出来,并以一种我对它们感到兴奋的方式去追求它们,哪怕我知道大多数最终都不会成功。在我职业生涯早期,我曾经有过一个非常聪明的想法,但它最终没能实现,我当时就被压垮了。但现在我能够做到的是,我变得很擅长挖掘自己的想法,然后实践它们,这个过程几乎变成了一个游戏,仿佛在看“我能多快打破自己的想法,而不是一味地敝帚自珍?”

我现在就有几个这样的想法了,我正在探索和实践过程之中。但这些想法,或者是技术、办法很抽象,和现在深度学习做事的逻辑差不多。

所以,扩大规模这件事,我想要再缓一缓。因为现在有很多公司说,“我们需要筹集 1 亿美元、2 亿美元,因为我们需要有一个装满 GPU 的仓库。”这是一种获得价值的办法,而且还比较有动力。但我想说的是,“不,我想在浪费某人 1 亿美元之前弄清楚几件重要的事情。”实际上我现在并没有花很多钱。我筹集了 2000 万美元,但我认为这是一项长达 10 年的任务,我不想在接下来的两年内烧掉 2000 万美元,然后再做另一个系列来获得另外几亿美元,因为我实际上并不认为这是个明智的方法。

我希望我可以花几年时间来解决其中的一些问题,做一些我觉得方向正确的小东西。然后,对其进行一定程度的扩展,将这些信息和体验拓展到整个生命周期,看看它是否会产生一些火花四射的东西。

我一直在说的是,一旦你的研究长成了蹒跚学步的孩子,也就是说,它是存在的,而且是有意识的,但它不是爱因斯坦,甚至也不会做乘法。如果你有了一个可以学习的生物,你可以与之互动并在某种程度上教它一些东西。到那个时候,你就可以组建一支由工程师、发展心理学家和科学家组成的庞大队伍来进行后续的研究了。

因为我们现在的研究还没有达到那样的水平,所以我们没有能力模拟像那样的东西。人类的大脑所拥有的一些想法、技巧和策略是我们现有的模型都做不到的。但实现人工智能这一点对我来说并非遥不可及。


Q:那您觉得我们应该如何实现呢?

A:我知道目的地是什么。我也知道它就在那里,但是,要到达那个目的地的话,路上迷雾重重,阴云密布。也没有人知道该如何抵达那里。但我看着那条路说我不知道那里有什么,但我想至少我可以抵达这个目的地——或者至少我认为有人会。我认为这很可能会在 21世纪30 年代发生。

我确实认为我们总能抵达的那个终点的(AGI)。我一直以来,我一直擅长的很多事情,都会带来最终的成果,这在历史长河中是无可避免的。就好比我之前做过的 3D 视频游戏,总是能成的,哪怕我没有在这几年做成,未来也总能做成它。

推荐阅读

欢迎大家加入DLer-计算机视觉技术交流群!

大家好,群里会第一时间发布计算机视觉方向的前沿论文解读和交流分享,主要方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如图像分类+上交+小明)

25044e17b7f3fbb893275e77c547302c.jpeg

👆 长按识别,邀请您进群!

0947eb195151b1665aa5fce01fc24095.gif

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值