浅析ChatGPT-语义语法和计算语言的力量

浅析ChatGPT-语义语法和计算语言的力量

产生“有意义的人类语言”需要什么?过去,我们可能认为人类大脑必不可少。但现在我们知道,ChatGPT 的神经网络也可以做得非常出色。这或许就是我们所能达到的极限,没有比这更简单(或更易于人类理解)的方法可以使用了。不过,我强烈怀疑 ChatGPT 的成功暗示了一个重要的“科学”事实:有意义的人类语言实际上比我们所知道的更加结构化、更加简单,最终可能以相当简单的规则来描述如何组织这样的语言。

正如上面提到的,句法语法为如何组织人类语言中属于不同词性的词提供了规则。但是为了处理意义,我们需要更进一步。一种方法是不仅考虑语言的句法语法,还要考虑语义语法。

对于句法,我们识别出名词和动词,等等。但对于语义,我们需要“更精细的分级”。例如,我们可以识别出“移动”的概念和一个“不因位置而改变身份”的“对象”的概念。这些“语义概念”的例子数不胜数。但对于我们要用的语义语法,只需要一些基本的规则,基本上来说就是“对象”可以“移动”。关于这可能如何工作,有很多要说的(其中一些之前已经说过)。但我在这里只会说几句表明一些潜在前进道路的话。

值得一提的是,即使一句话在语义语法上完全没问题,也不意味着它已经(或者能)在实践中成真。“The elephant traveled to the Moon”(大象去了月球)这句话毫无疑问会“通过”我们的语义语法,但(至少目前)在我们的现实世界中还没有成真,虽然它绝对可以在虚构的世界中成真。

当我们开始谈论“语义语法”时,很快就会问:它的底层是什么?它假设了什么样的“世界模型”?句法语法实际上只是关于由词构建语言的。但是语义语法必然涉及某种“世界模型”—类似于“骨架”,由实际的词构成的语言可以基于它分层。

直到不久之前,我们可能还是认为(人类)语言将是描述“世界模型”的唯一通用方式。几个世纪前,人们就已经开始针对特定种类的事物进行形式化,特别是基于数学。但是现在有了一种更通用的形式化方法:计算语言。

是的,这是我四十多年来一直在研究的大型项目(现在体现在 Wolfram 语言中):开发一种精确的符号表示,以尽可能广泛地谈论世界上的事物,以及我们关心的抽象事物。例如,我们有城市、分子、图像和神经网络的符号表示,还有关于如何计算这些事物的内置知识。

经过几十年的努力,我们已经在许多领域中运用了这种方法。但是过去,我们并没有特别用其处理“日常话语”。在“我买了两斤苹果”中,我们可以轻松地表示“两斤苹果”(并进行有关的营养和其他计算),但是(还)没有找到“我买了”的符号表示。

这一切都与语义语法的思想有关—目标是拥有一个对各种概念通用的符号“构造工具包”,用于对什么可以与什么组合在一起给出规则,从而对可以转化为人类语言的“流”给出规则。

假设我们有这种“符号话语语言”,我们会用它做什么呢?首先可以生成“局部有意义的文本”。但最终,我们可能想要更有“全局意义”的结果—这意味着“计算”更多实际存在或发生于世界(或某个与现实一致的虚构世界)中的事情。

在 Wolfram 语言中,我们已经拥有了关于许多种事物的大量内置计算知识。但如果要建立一种完整的符号话语语言,我们还需要纳入关于世界上一般事物的额外“计算方法”(calculi):如果一个物体从 A 移动到 B,然后从 B 移动到 C,那么它就从 A 移动到了 C,等等。

我们不仅可以用符号话语语言来做“独立的陈述”,而且可以用它来问关于世界的问题,就像对 Wolfram|Alpha 所做的那样。此外,也可以用它来陈述我们“想要实现”的事情,这可能需要一些外部激活机制;还可以用它来做断言—也许是关于实际世界的,也许是关于某个我们正在考虑的(无论是虚构还是其他的)特定世界的。

人类语言是不精确的,这主要是因为它没有与特定的计算实现相“结合”,其意义基本上只由其使用者之间的“社会契约”定义。但是,计算语言在本质上具有一定的精确性,因为它指定的内容最终总是可以“在计算机上毫无歧义地执行”。人类语言有一定的模糊性通常无伤大雅。(当我们说“行星”时,是否包括外行星呢?等等。)但在计算语言中,我们必须对所做的所有区别进行精确和清晰的说明。

在计算语言中,利用普通的人类语言来创造名称通常很方便。但是这些名称在计算语言中的含义必须是精确的,可能涵盖也可能不涵盖典型人类语言用法中的某些特定内涵。

如何确定适用于一般符号话语语言的“本体论”(ontology)呢?这并不容易。也许这就是自亚里士多德 2000 多年前对本体论做出原始论述以来,在这些方面几乎没有什么进展的原因。但现在,我们已经知道了有关如何以计算的方式来思考世界的许多知识,这确实很有帮助(从我们的 Physics Project 和 ruliad1思想中得到“基本的形而上学”也无妨)。

1ruliad 是本书作者创造的概念,即所有可能的计算过程的纠缠上限:以各种可能的方式遵循所有可能的计算规则的结果。详见文章“The Concept of the Ruliad”。——编者注

所有这些在 ChatGPT 中意味着什么呢?在训练中,ChatGPT 有效地“拼凑出”了一定数量(相当惊人)的相当于语义语法的东西。它的成功让我们有理由认为,构建在计算语言形式上更完整的东西是可行的。与我们迄今为止对 ChatGPT 内部的理解不同的是,我们可以期望对计算语言进行设计,使其易于被人类理解。

当谈到语义语法时,我们可以将其类比于三段论逻辑。最初,三段论逻辑本质上是关于用人类语言所表达的陈述的一组规则。但是,当形式逻辑被发展出来时(没错,在 2000 多年之后),三段论逻辑最初的基本结构也可以用来构建巨大的“形式化高塔”,能用于解释(比如)现代数字电路的运作。因此,我们可以期待更通用的语义语法也会如此。起初,它可能只能处理简单的模式,例如文本。但是,一旦它的整体计算语言框架被建立起来,我们就可以期待用它来搭建“广义语义逻辑”的高塔,让我们能够以精确和形式化的方式处理以前接触不到的各种事物(相比之下,我们现在只能在“地面层”处理人类语言,而且带有很大的模糊性)。

我们可以将计算语言—和语义语法—的构建看作一种在表示事物方面的终极压缩。因为它使我们不必(比如)处理存在于普通人类语言中的所有“措辞”,就能够谈论可能性的本质。可以认为 ChatGPT 的巨大优势与之类似:因为它也在某种意义上“钻研”到了,不必考虑可能的不同措辞,就能“以语义上有意义的方式组织语言”的地步。

如果我们将 ChatGPT 应用于底层计算语言,会发生什么呢?计算语言不仅可以描述可能的事物,而且还可以添加一些“流行”之感,例如通过阅读互联网上的所有内容做到。但是,在底层,使用计算语言操作意味着像 ChatGPT 这样的系统可以立即并基本地访问能进行潜在不可约计算的终极工具。这使 ChatGPT 不仅可以生成合理的文本,而且有望判断文本是否实际上对世界(或其所谈论的任何其他事物)做出了“正确”的陈述。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值