【AI学习】OpenAI员工关于AI 模型的观点:模型代表的是数据集而不是模型参数

看到jbetker发表于2023年6月10日的一篇博客,非常短,但是观点却非常让人震撼。

他的观点:对于一个数据集,不同的模型都是在学习数据集中的数据概率分布,所以只要方法正确、训练时间足够,很多方法最终都能有效的对数据集进行学习

文章翻译如下:

我在OpenAI已经快一年了。在那段时间里,我训练了很多生成模型。当我花了这些小时观察调整各种模型配置和超参数的效果时,有一件事让我印象深刻,那就是所有训练运行之间的相似之处。

我越来越清楚,这些模型确实在以令人难以置信的程度逼近他们的数据集。这意味着他们不仅学会了成为狗或猫意味着什么,还学会了无关紧要的分布之间的间隙频率,这些频率并不重要,比如人类可能会拍摄哪些照片或人类通常写下的单词。

这表现为——在同一数据集上训练足够长的时间,几乎每个具有足够权重和训练时间的模型都收敛到同一点。足够大的扩散 conv-unet 产生与ViT生成器相同的图像。AR采样产生与扩散相同的图像。

这是一个令人惊讶的观察结果!这意味着模型行为不是由体系结构、超参数或优化器选择决定的。它由您的数据集决定,仅此而已。其他一切都是有效交付计算以近似该数据集的手段。

然后,当你提到“Lambda”、“ChatGPT”、“Bard”或“Claude”时,你指的不是模型权重,而是数据集。

文章链接:https://nonint.com/2023/06/10/the-it-in-ai-models-is-the-dataset/

  • 4
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值