Bytedance揭秘OpenAI大模型: GPT-3到GPT-4进化路径

GPT-Fathom: Benchmarking Large Language Models to Decipher the Evolutionary Path towards GPT-4 and Beyond

在这里插入图片描述

在这里插入图片描述

探秘GPT-3到GPT-4进化之路

1、SFT:早期GPT进化的推动者

SFT只在较弱的基础模型上管用,用在更强的模型上收效甚微。类似现象在开源模型身上也可见(这个评测还测了Llama1和2、PaLM2-L、Claude 2等模型):

在初代Llama-65B之上,SFT成功提升了它在MMLU基准上的性能,但是,所有使用了SFT改进的Llama2-70B在Open LLM Leaderboard榜单上却只表现出微小的进步。

总结:在GPT3阶段,SFT技术对模型的进化起到了关键作用。

2、RLHF和SFT:编码能力提升的功臣

顺着GPT3.5系列接着看,从text-davinci-002开始,OpenAI开始引入新技术基于PPO算法的RLHF,得到text-davinci-003。

此时,它在大部分基准上的表现和前代模型持平或略变差,说明作用不是特别明显(在开源模型身上也是如此)。

但有一个除外:编码任务,最高足足增加了近30分。

LLM仍可以通过SFT和RLHF,不断将内在能力(但需要多次尝试)转化成一次性解决问题的能力,不断逼近LLM的能力上限。

3、代码加入预训练,对推理帮助最大

在GPT4进化之路上,还出现了2个特别的模型:

code-cushman-001 (Codex-12B)code-davinci-002

前者是OpenAI初次尝试使用代码数据训练模型,尽管它的规模较小,但也取得了不错的代码能力。后者是GPT3.5的基座模型,它是在GPT3的基础上使用RLHF+代码训练的结果,也就是文本和代码混合预训练。

可以看到,它大幅超越GPT-3(不止是编码能力)、在一些推理任务上(如BBH)表现甚至可以超过后面的gpt-3.5-turbo-0613。

4、“跷跷板”现象

通过比较2023年3月和2023年6月的OpenAI API模型,我们确实可以发现这一现象:

与gpt-3.5-turbo-0301相比,升级后的gpt-3.5-turbo-0613在HumanEval上表现出色(53.9 -> 80.0),但在MATH上却大幅下降(32.0 -> 15.0)。

gpt-4-0613在DROP上的表现优于gpt-4-0314 (78.7 -> 87.2) ,但在MGSM上也出现了直线下降(82.2 -> 68.7) 。

作者认为:

“跷跷板现象”可能成为LLM通往AGI之路的绊脚石,因为AGI强调“通用智能”,要在所有task上都有优异的性能,要求模型不能“偏科”。在此,他们也呼吁社区重视这个问题,共同推进大模型平衡发展的研究。

论文地址

https://arxiv.org/abs/2309.16583

项目链接

https://github.com/GPT-Fathom/GPT-Fathom

Reference

https://mp.weixin.qq.com/s/-AWkDzAzoyQNmgYXuC6B4w

Easter Egg (彩蛋)

2023未来科学大奖获奖者学术报告会。何恺明博士:深度残差学习及其如何塑造人工智能模式。

https://www.bilibili.com/video/BV1QN41137qC/?share_source=copy_web&vd_source=d36cffbac473c310cc0a7bd6e55fc357
在这里插入图片描述
在这里插入图片描述

Egg1:AlphaGo

在这里插入图片描述

Egg2:GPT

在这里插入图片描述

Egg3:AlphaFold

在这里插入图片描述

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
bytegraph是字节跳动开发的一款高性能分布式图数据库。图数据库是一种使用图结构存储和处理数据的数据库管理系统,适用于处理大量相互关联的数据和复杂的数据查询。 bytegraph具有以下特点: 1. 高性能:bytegraph使用分布式架构,可以水平扩展以应对更大规模的数据和负载。它采用了一系列的优化技术,如基于图模型的数据划分和存储方式、高效的图查询算法等,以实现快速的数据访问和处理。 2. 分布式:bytegraph采用了分布式存储和计算的架构,可以将数据分布在多台机器上,实现数据的并行处理和高可用性。通过数据的分区和复制,bytegraph可以提供良好的数据可靠性和容错能力。 3. 灵活的数据模型bytegraph支持灵活的图数据模型,可以存储和处理复杂的数据结构和关系。它基于标签-属性模型,标签表示数据的类型,属性表示数据的属性值。用户可以根据自己的需求定义和使用不同的标签和属性,以适应各种数据场景。 4. 大数据处理:bytegraph适用于处理大规模的数据集。它具有高效的图遍历和查询算法,可以快速地进行复杂的数据查询和分析。同时,bytegraph支持图计算框架,并与字节跳动的分布式计算平台进行了紧密集成,可以更好地支持大规模图计算任务。 5. 应用广泛:bytegraph可以应用于各种领域,如社交网络分析、推荐系统、知识图谱构建等。它能够帮助用户从海量的图数据中提取有价值的信息,支持复杂的数据挖掘和分析任务。 综上所述,bytegraph是一款高性能的分布式图数据库,具备分布式、灵活的数据模型和大数据处理能力,应用广泛于各种领域。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

猛码Memmat

欢迎支持,随缘打赏 ~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值