【AI学习】OpenAI员工关于AI 模型的观点：模型代表的是数据集而不是模型参数

bylander

已于 2024-06-30 22:25:26 修改

阅读量251

点赞数 4

分类专栏： AI学习文章标签：人工智能学习 chatgpt 深度学习

于 2024-06-30 22:18:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bylander/article/details/140087488

版权

AI学习专栏收录该内容

35 篇文章 0 订阅

订阅专栏

看到jbetker发表于2023年6月10日的一篇博客，非常短，但是观点却非常让人震撼。

他的观点：对于一个数据集，不同的模型都是在学习数据集中的数据概率分布，所以只要方法正确、训练时间足够，很多方法最终都能有效的对数据集进行学习

文章翻译如下：

我在OpenAI已经快一年了。在那段时间里，我训练了很多生成模型。当我花了这些小时观察调整各种模型配置和超参数的效果时，有一件事让我印象深刻，那就是所有训练运行之间的相似之处。

我越来越清楚，这些模型确实在以令人难以置信的程度逼近他们的数据集。这意味着他们不仅学会了成为狗或猫意味着什么，还学会了无关紧要的分布之间的间隙频率，这些频率并不重要，比如人类可能会拍摄哪些照片或人类通常写下的单词。

这表现为——在同一数据集上训练足够长的时间，几乎每个具有足够权重和训练时间的模型都收敛到同一点。足够大的扩散 conv-unet 产生与ViT生成器相同的图像。AR采样产生与扩散相同的图像。

这是一个令人惊讶的观察结果！这意味着模型行为不是由体系结构、超参数或优化器选择决定的。它由您的数据集决定，仅此而已。其他一切都是有效交付计算以近似该数据集的手段。

然后，当你提到“Lambda”、“ChatGPT”、“Bard”或“Claude”时，你指的不是模型权重，而是数据集。

文章链接：https://nonint.com/2023/06/10/the-it-in-ai-models-is-the-dataset/

关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
【AI学习】OpenAI员工关于AI 模型的观点：模型代表的是数据集而不是模型参数

模型行为不是由体系结构、超参数或优化器选择决定的。它由您的数据集决定，仅此而已。其他一切都是有效交付计算以近似该数据集的手段。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。