斯坦福 2025 AI 研究报告:中美人工智能差距缩小至0.3%

斯坦福大学以人为本人工智能研究院发布的《2025年人工智能指数报告》从科学角度深入分析中美人工智能领域的竞争格局。

图片

技术突破:更强性能与更低成本

2024年,AI性能飞升,先进AI系统能达到的极限也被不断突破。

在新基准测试(MMMU、GPQA、SWE-bench)中,AI系统的表现比去年增幅明显,分别达到了18.8%、48.9%以及67.3%。

在实际应用中,AI编程已接近人类水平,2小时内的短期任务效率已远超人类,可达到专家的4倍。AI生成高质量视频能力大幅提升,如Sora模型已展示出“叙述故事来生成视频”的能力概念,创意和艺术内容产出将更加便捷。

在性能飞升的同时,参数量和推理成本却在大幅降低。

在基准测试MMLU中得分相似的PaLM(2022年)参数量为5400亿,而微软Phi-3-mini(2024年)的参数量仅为38亿。

在基准测试MMLU中达到GPT-3.5水平的AI模型成本,骤降近300倍,从每百万token20美元降到了每百万token0.07美元。

图片

另有开源模型迅速崛起,为保证技术领先,大多科技巨头选择将优质模型闭源。但如今,开源模型在部分场景下已可挑战闭源巨头,其性能差距已从8%缩小至1.7%。

全球竞争:中美差距缩小至0.3%

2023年,在基准测试MMLU中,中国优秀模型比美国顶级模型落后20%,但2024年底,这一数据缩小至0.3%

图片

在数量上,美国在2024年主导研发了40个重要模型,中国有15个,而欧洲只有3个。

这可能与投资量有关。2024年,美国私营领域向AI投资1091亿美元,而中国这一数据仅为93美元。

但中国在人工智能技术落地方面有极高表现。

华为盘古大模型已在工业场景中深度应用,百度Apollo Go自动驾驶服务已覆盖数十个城市,DeepSeek已在政务和工作应用中普及,大多数普通人也已习惯使用AI解决问题。    

在AI前沿,竞争已达白热化。激烈的竞争导致模型规模增长速度令人震惊,训练算力5个月就能翻倍,数据集8个月翻倍。

但顶级模型的差距在逐步缩小,前十名榜单得分已从11.9%分差降至5.4%。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值