浅析ChatGPT-什么是模型

最新推荐文章于 2024-08-01 00:35:36 发布

andyyah晓波

最新推荐文章于 2024-08-01 00:35:36 发布

阅读量264

点赞数 9

分类专栏：浅析ChatGPT 文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/andyyah/article/details/139982906

版权

浅析ChatGPT 专栏收录该内容

20 篇文章 0 订阅

订阅专栏

浅析ChatGPT-什么是模型

假设你想（像 16 世纪末的伽利略一样）知道从比萨斜塔各层掉落的炮弹分别需要多长时间才能落地。当然，你可以在每种情况下进行测量并将结果制作成表格。不过，你还可以运用理论科学的本质：建立一个模型，用它提供某种计算答案的程序，而不仅仅是在每种情况下测量和记录。

假设有一些（理想化的）数据可以告诉我们炮弹从斜塔各层落地所需的时间。

在这里插入图片描述

如何计算炮弹从一个没有明确数据的楼层落地需要多长时间呢？在这种特定情况下，可以使用已知的物理定律来解决问题。但是，假设我们只有数据，而不知道支配它的基本定律。那么我们可能会做出数学上的猜测，比如也许应该使用一条直线作为模型。

在这里插入图片描述

虽然我们可以选择不同的直线，但是上图中的这条直线平均而言最接近我们拥有的数据。根据这条直线，可以估计炮弹从任意一层落地的时间。

我们怎么知道要在这里尝试使用直线呢？在某种程度上说，我们并不知道。它只是在数学上很简单，而且我们已经习惯了许多测量数据可以用简单的数学模型很好地拟合。还可以尝试更复杂的数学模型，比如 a+bx+cx^2，能看到它在这种情况下做得更好。

在这里插入图片描述

不过，这也可能会出大问题。例如，下面是我们使用 a+b/x+c~\sin x 能得到的最好结果。

在这里插入图片描述

必须理解，从来没有“无模型的模型”。你使用的任何模型都有某种特定的基本结构，以及用于拟合数据的一定数量的“旋钮”（也就是可以设置的参数）。ChatGPT 使用了许多这样的“旋钮”—实际上有 1750 亿个。

但是值得注意的是，ChatGPT 的基本结构—“仅仅”用这么少的参数—足以生成一个能“足够好”地计算下一个词的概率的模型，从而生成合理的文章。

关注

9
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
浅析ChatGPT-什么是模型

不过，你还可以运用理论科学的本质：建立一个模型，用它提供某种计算答案的程序，而不仅仅是在每种情况下测量和记录。你使用的任何模型都有某种特定的基本结构，以及用于拟合数据的一定数量的“旋钮”（也就是可以设置的参数）。但是值得注意的是，ChatGPT 的基本结构—“仅仅”用这么少的参数—足以生成一个能“足够好”地计算下一个词的概率的模型，从而生成合理的文章。虽然我们可以选择不同的直线，但是上图中的这条直线平均而言最接近我们拥有的数据。假设有一些（理想化的）数据可以告诉我们炮弹从斜塔各层落地所需的时间。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。