大家可能听过这样一个猜想:
如果让无数只猴子(或者一只猴子无限长时间)在打字机或键盘上随机按键,只要有足够的时间,它们几乎必然能打出一部完整的莎士比亚著作(比如《哈姆雷特》的全部文本)。
这就是所谓的“无限猴子”定理。
这个理论基于概率无限叠加的概念。因为只要有无限的时间和随机组合,即便是概率极低的事件也一定会几乎肯定发生。
而实际上,这种概率近乎接近于1的事件,实际上毫无发生可能性。理由很简单,没有那么一只能活到宇宙末日的猴子,也没有一台能够终生保修到热寂的打字机。
如果把猴子打字当成“tokens”,把无数只猴子当成“GPU”,大模型和“无限猴子”似乎有了某种可悲的相似性。
尽管大模型不是完全随机,而是掌握了语言学的某种低维流形(比如用向量空间表示语义),它比猴子高明的一点是,它知道“TO BE”后面大概率会加上“OR NOT TO BE”。
所以,我们有没有能坚持到世界末日的机房,有没有无限量的GPU(猴子?),能让大模型输出一部莎士比亚呢?
这似乎是无可能的。大模型本质上是统计幻觉。
所以,把大模型当作“人工智能”,是否合适?它到底哪里体现出来了“智能”呢?智能不靠概率,或者这就叫“上帝不掷骰子”?
恕我失敬了。人工智能取代人类的说法,我相当的不以为然,照相机诚然是个好发明,让很多退休大爷找到了业余爱好,但画家可不依然活得好好的?
以上的观点并不是什么新想法,甚至是非常陈旧的,从这方面说,人类的思想是走在实践之前的。哲学家约翰·塞尔 (John Searle) 在 1980 年的一篇题为“思想、大脑和程序”的论文中提出了“中国房间”的思想实验。
在思想实验中,Searle 想象了一个不懂中文的人被隔离在一个房间里,房间里有一本书,里面有作中文符号的详细说明。当中文文本被传递到房间时,这个人按照书的指示产生中文符号,对于房间外流利的中文使用者来说,这些符号似乎是适当的回应。根据 Searle 的说法,这个人只是遵循句法规则,没有语义理解,无论是人类还是整个房间都听不懂中文。他认为,当计算机执行程序时,它们同样只是在应用句法规则,而没有任何真正的理解或思考。
40多年过去了,终于走到了验证这个思想实验的时候。