斯坦福 2025 AI 研究报告：中美人工智能差距缩小至0.3%

蜂耘

已于 2025-04-10 11:26:13 修改

阅读量211

点赞数

文章标签：人工智能

于 2025-04-10 11:10:46 首次发布

原文链接：https://mp.weixin.qq.com/s/R7o1Slwipv1gp014z04jAg

版权

斯坦福大学以人为本人工智能研究院发布的《2025年人工智能指数报告》从科学角度深入分析中美人工智能领域的竞争格局。

技术突破：更强性能与更低成本

2024年，AI性能飞升，先进AI系统能达到的极限也被不断突破。

在新基准测试（MMMU、GPQA、SWE-bench）中，AI系统的表现比去年增幅明显，分别达到了18.8%、48.9%以及67.3%。

在实际应用中，AI编程已接近人类水平，2小时内的短期任务效率已远超人类，可达到专家的4倍。AI生成高质量视频能力大幅提升，如Sora模型已展示出“叙述故事来生成视频”的能力概念，创意和艺术内容产出将更加便捷。

在性能飞升的同时，参数量和推理成本却在大幅降低。

在基准测试MMLU中得分相似的PaLM（2022年）参数量为5400亿，而微软Phi-3-mini（2024年）的参数量仅为38亿。

在基准测试MMLU中达到GPT-3.5水平的AI模型成本，骤降近300倍，从每百万token20美元降到了每百万token0.07美元。

另有开源模型迅速崛起，为保证技术领先，大多科技巨头选择将优质模型闭源。但如今，开源模型在部分场景下已可挑战闭源巨头，其性能差距已从8%缩小至1.7%。

全球竞争：中美差距缩小至0.3%

2023年，在基准测试MMLU中，中国优秀模型比美国顶级模型落后20%，但2024年底，这一数据缩小至0.3%。

在数量上，美国在2024年主导研发了40个重要模型，中国有15个，而欧洲只有3个。

这可能与投资量有关。2024年，美国私营领域向AI投资1091亿美元，而中国这一数据仅为93美元。

但中国在人工智能技术落地方面有极高表现。

华为盘古大模型已在工业场景中深度应用，百度Apollo Go自动驾驶服务已覆盖数十个城市，DeepSeek已在政务和工作应用中普及，大多数普通人也已习惯使用AI解决问题。

在AI前沿，竞争已达白热化。激烈的竞争导致模型规模增长速度令人震惊，训练算力5个月就能翻倍，数据集8个月翻倍。

但顶级模型的差距在逐步缩小，前十名榜单得分已从11.9%分差降至5.4%。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。