浅析ChatGPT-简单的例子

浅析ChatGPT-简单的例子

ChatGPT 本质上是一种生成语言输出的系统,其输出遵循来自互联网和书籍等的训练材料中的“模式”。令人惊奇的是,输出的类人特征不仅体现在小范围内,而且在整个文章中都很明显。它可以表达连贯的内容,通常以有趣和出人意料的方式包含它所学的概念。产生的内容始终是“在统计学上合理”的,至少是在语言层面上合理的。尽管它的表现非常出色,但这并不意味着它自信给出的所有事实和计算都一定是正确的。

下面是我刚刚注意到的一个例子(ChatGPT 具有内在的随机性,因此如果你尝试问相同的问题,可能会得到不同的答案)。

在这里插入图片描述

听起来相当有说服力。但是事实证明它是错误的,因为 Wolfram|Alpha 可以告诉我们如下答案。

在这里插入图片描述

当然,这显得不太公平,因为这个问题正是 Wolfram|Alpha 擅长的问题类型:可以基于其结构化、有条理的知识进行精确计算。

有趣之处是,我们可以想象让 Wolfram|Alpha 自动帮助 ChatGPT。可以通过编程向 Wolfram|Alpha 提问(也可以使用 Web API 等)。

在这里插入图片描述

现在再次向 ChatGPT 提问,并附上此结果。

在这里插入图片描述

ChatGPT 非常礼貌地接受了更正。如果你再次提出该问题,它会给出正确的答案。显然,可以用一种更精简的方式处理与 Wolfram|Alpha 的交流,但是看到这种非常简单的纯自然语言方法已经基本奏效也很令人高兴。

不过,为什么 ChatGPT 一开始会犯这个错误呢?如果它在训练时从某个地方(例如互联网上)看到了芝加哥和东京之间的具体距离,它当然可以答对。但在本例中,仅仅依靠神经网络能轻松完成的泛化(例如对于许多城市之间距离的许多示例的泛化)并不够,还需要一个实际的计算算法。

Wolfram|Alpha 的处理方式则截然不同。它接受自然语言,然后(假设可能的话)将其转换为精确的计算语言(即 Wolfram 语言),在本例中如下所示。

在这里插入图片描述

城市的坐标和计算距离的算法是 Wolfram 语言内置的计算知识的一部分。是的,Wolfram 语言拥有大量内置的计算知识—这是我们几十年的工作成果,我们精心梳理了不断更新的海量数据,实现(而且经常发明)了各种方法、模型和算法—并且系统地为一切构建了一整套连贯的计算语言。
ChatGPT 和 Wolfram|Alpha 的工作方式截然不同,各有优势。为了理解 ChatGPT 可以如何利用 Wolfram|Alpha 的优势,让我们讨论 ChatGPT 本身并不能完全回答正确的一些情况。ChatGPT 像人类一样,经常在数学领域遇到困难。

在这里插入图片描述

很有趣的文章式回答,但实际结果是错误的。

在这里插入图片描述

如果让 ChatGPT“咨询”Wolfram|Alpha,它当然可以得到正确的答案。

让我们尝试一些稍微复杂的问题。

在这里插入图片描述

乍一看,这个结果似乎很棒,我很容易相信它。然而,事实证明它是错误的,因为 Wolfram|Alpha 可以告诉我们如下答案。

在这里插入图片描述

因此,使用(不能咨询 Wolfram|Alpha 的)ChatGPT 做数学作业可能不是一个好主意。它可以给你一个看似非常可信的答案。

在这里插入图片描述

但是如果 ChatGPT 没有“真正理解数学”,就基本上不可能可靠地得出正确答案。所以,答案又是错误的。

在这里插入图片描述

ChatGPT 甚至可以为“它得出答案的方式”(尽管并不是它所“做”的真正方式)编造一个非常像样的解释。此外,迷人(和有趣)的是,它给出的解释里存在不理解数学的人类可能会犯的错误。

在这里插入图片描述

在各种各样的情况下,“不理解事物的含义”都可能会引起麻烦。

在这里插入图片描述

听起来颇有说服力,但不正确。

在这里插入图片描述

ChatGPT 似乎在某处正确地学习了这些基础数据,但它并没有充分“理解数据的含义”以正确地排列这些数字。

在这里插入图片描述

是的,可以找到一种方法来“修复这个特定的 bug”。但问题在于,像 ChatGPT 这样基于生成语言的 AI 系统的基本思想并不适用于需要执行结构化计算任务的情况。换句话说,需要“修复”几乎无穷多的“bug”,才能追赶上 Wolfram|Alpha 以其结构化方式所能实现的几乎无穷小的成就。

“计算链”越复杂,就越有可能需要调用 Wolfram|Alpha 来正确处理。对于下面的问题,ChatGPT 给出了一个相当混乱的答案。

在这里插入图片描述

正如 Wolfram|Alpha 告诉我们的那样,ChatGPT 的结论并不正确(就像它自己在某种程度上“已经知道”的)。

在这里插入图片描述

每当涉及特定的(例如数量)数据时,即使是相当原始的形式,也往往更适合用 Wolfram|Alpha 处理。以下这个例子受到了长期以来最受喜爱的 Wolfram|Alpha 测试查询“How many turkeys are there in Turkey?”(土耳其有多少只火鸡)的启发。

在这里插入图片描述

这(一开始)看起来完全有道理,甚至引用了相关的来源。然而事实证明,这些数据基本上只是“捏造”的。

在这里插入图片描述

不过,非常好的一点是,ChatGPT 可以轻松地“请求事实来做检查”。

在这里插入图片描述

现在将这些请求通过 Wolfram|Alpha API 进行馈送。

在这里插入图片描述

现在我们可以注入这些数据,要求 ChatGPT 修正其原始回答(甚至以粗体显示它所做的修正)。

在这里插入图片描述

当涉及实时(或依赖位置等的)数据或计算时,“注入事实”的能力特别好。ChatGPT 不会立即回答下面这个问题。

在这里插入图片描述

下面是一些相关的 Wolfram|Alpha API 输出。

在这里插入图片描述

如果将其输入 ChatGPT,它会生成漂亮的文章式结果。

在这里插入图片描述

有时,计算系统和类人系统之间会有有趣的相互作用。下面是一个向 Wolfram|Alpha 提出的相当异想天开的问题,而它甚至会询问你是否想要“soft-serve ice cream”(软冰激凌)。

在这里插入图片描述

ChatGPT 最开始对于“volume”(体积)的概念有些困惑。

在这里插入图片描述

但后来它似乎“意识到”那么多冰激凌是相当愚蠢的。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值