对待GPT-4要保持冷静——对话罗德尼·布鲁克斯(1):别再把效率与能力混为一谈

技术的高速发展与进步难免会让人们感到不安,因为它们有时会带来一些残酷的影响,这点在商业活动、就业市场和文化领域等方面可见一斑。
因此,当前人们对于大型的语言模型的惊叹与敬畏也是如此(例如来自 OpenAI GPT-4)。
GPT-4可谓是一个教科书般的例子,它证明了科技的胜利往往伴随着惊喜,甚至是焦虑。罗德尼·布鲁克斯 (Rodney Brooks)指出,这并不是什么新鲜事。

RODNEY BROOKS: CHRISTOPHER MICHEL/WIKIPEDIA; BACKGROUND: RUBY CHEN/OPENAI

作为著名的机器人研究人员、学者和企业家,布鲁克斯还是 AI 方面的权威:他在2007年前都说麻省理工学院计算机科学和人工智能实验室的负责人。在此之前,他还在卡内基梅隆大学和斯坦福大学担任教授。

布鲁克斯目前正在从事他的第三家机器人创业公司Robust.AI的工作。他撰写了数百篇相关文章,出版过六本书,并拍摄了电影《速度、廉价和失控》中。他是一位罕见的技术领导者,在商业和学术界都拥有辉煌的职业生涯。
与此同时,布鲁克斯仍然抽出时间通过书籍、热门文章、TED 演讲等各种方式接触流行文化。
虽然它给出了不容置疑的答案,使我对它有些信服,但是,有一半的时候,它是完全错误的。                                                                       —  罗德尼·布鲁克斯《人工智能机器人》

IEEE Spectrum网站在最新的智能创新峰会上采访了布鲁克斯,他在会上荣获 2023 年度IEEE 创始人奖章。
当提及当下的 AI时,他并不像他的一些同行那样担心。至于他刚刚创办的公司,布鲁克斯表示公司正在开发专门适用于中型仓库的机器人。

Q:你在 2017 年写了一篇著名的文章《关于AI预测能力的七宗罪》。你当时说你想要一种通用人工智能——你说这其实一直是你从事机器人和人工智能领域的动机。但你也说过,当时 关于AGI 的研究还不完善,特别是在解决 50 年来一直无法攻克的基本问题方面。这些都让我感觉,你并不认为DPT-4和其他大型语言模型的出现能够让 AGI 将在十年内成为可能。
R.B 完全正确。顺便说一句,GPT-3.5 猜对了——我问过它怎么看待我,它说我对它持怀疑态度。但这并不能使它成为 真正的AGI。
大型语言模型确实有些令人惊讶的地方,我后面会提到。
就像很多人说的,我们的语言中有不少属于死记硬背的内容,而不是自然生成的,因为它们可以提炼为某些参数,这点很有趣。然而,在那篇《七宗罪》的文章中,我说过其中一个致命的错误便是人类如何将性能误认为是能力。
举个例子,当我们看到一个人在有关智力的方面上表现出一定的水平,比如描述出图片中的内容,从他的表现中我们可以概括出他们在这个领域内的能力。从进化的角度来看,这理应是我们能够做到的事情。我们通过看到一个人做了一件事,我们就能知道他还有哪些能力,我们对此能很快做出判断。但是,我们从表现力推测出能力的思路并不适用于人工智能系统。
我当时在书中举的例子是一个谷歌程序,它可以标记出人们在公园玩飞盘的图像。如果一个人说,“哦,那是一个在公园里玩飞盘的人”,你或许会问这个人一个问题,比如“你能吃飞盘吗?” 他们当然知道自己不会,因为飞盘是塑料做的。
你只是预想他们能回答出类似的问题,“你能在暴风雪中玩飞盘吗?”或是“一个人可以将飞盘扔多远?他们能把它扔 10 英里吗?他们只能扔10厘米吗?” 当一个人说“那是一张人们在公园里玩飞盘的照片”时,你只是预测仅仅从这一个表现中就能看出所有的能力。
大型语言模型擅长的是给出一个听起来很像是答案的回应,但是这与答案实际上应该是什么有着本质的区别。                                                 ——罗德尼·布鲁克斯《人工智能机器人》
我们无法从大型语言模型的表现中获得相同水平的能力。当你戳穿它时,你会发现它并没有那种在第一个答案中听起来合理的逻辑推理。
在过去的几周里,我一直在使用大型语言模型来帮助我完成我所做的特别深奥的编码,它们确实比搜索引擎要好得多。毫无疑问,这是因为它有 4,000 个参数或标记,甚至多达 60,000 个标记,所以它比仅使用 10 个词语的Google搜索要好用得多。也就是说它有上下文的参照,所以当我做一些特别深奥的事情时,它会给我提供点帮助。
但也有些我一直无法避免的事情,我一直在犯同一个错误——AI以如此自信的方式回答我提出的任何问题。  它对自己给出的答案有充分的自信,我也确实有些信服。可是这些答案有一多半是错的。我花了两三个小时使用同一个提示,然后我说“这不管用”,它就转而用别的方法。这与真正意义上的智能不同,它甚至算不上是一种互动不同,它只是在检索信息。

Q:听起来你不认为 GPT-5 或 GPT-6 会在这些问题上取得很大进展?
R.B 不会,因为它没有任何关于这个世界的深层模型。它与世界没有任何联系,它只证明了语言之间的相关性。
顺便说一下,我推荐Stephen Wolfram 的一篇长篇博文,他还把它编成了一本书。
这本书对于技术方面的问题给出非常好的解释。大型语言模型擅长的是给出一个听起来很像是答案的回应,但是这与答案实际上应该是什么有着本质的区别。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值