2025年人工智能指数报告：12大趋势标志AI已超越可能

本文链接：https://blog.csdn.net/weixin_70720868/article/details/147084774

刚刚发布的《2025年人工智能指数报告》由斯坦福大学的以人为本人工智能研究所（Stanford HAI）共同领导的李飞飞教授团队编辑。这份报告总计超过456页，是该所第八次发布的AI Index研究，旨在全面追踪2024年全球人工智能领域的最新发展动向。

此次报告不仅涵盖了AI硬件进展的深度探讨，还对推理成本进行了全新的评估，分析了人工智能出版物和专利申请的动态。此外，新数据也揭示了企业在实施负责任AI实践方面的最新进展，突显了人工智能在科学与医疗领域中日渐重要的角色。

完整报告请参考：AI Index Report 2025

在其官网上，斯坦福HAI表示：“人工智能对社会的影响前所未有地显著......2025年的报告是我们迄今为止所做的最为广泛且重要的研究。”

该研究所也指出，“人工智能将会是21世纪最具颠覆性的科技之一。然而，唯有通过审慎的引导，才能确保这一技术能惠及大众。”

新报告中提出了2024年度人工智能领域的十二大趋势：

1. AI的性能在严苛基准下持续提升

2023年，研究者们提出了新的测试基准——MMMU、GPQA以及SWE-bench，以考察高级人工智能系统的极限。一年的时间内，AI在这些基准测试中的得分分别提高了18.8%、48.9%和67.3%。在生成高质量视频方面，AI系统也取得了显著的突破。在某些情况下，语言模型智能体在编程任务中表现已超越人类。

图：选定的AI指数技术性能基准与人类表现的对比

2. AI逐步融入日常生活

人工智能正在迅速从实验室走进我们的生活。从健康医疗到交通运输，2023年FDA批准了223种AI医疗设备，而在2015年这一数字仅为6种。自动驾驶汽车已不再是实验性技术，美国最大的运营商Waymo每周提供超过15万次自动驾驶出行，百度的“萝卜快跑”（Apollo Go）出租车也在中国的多个城市投入服务。

图：FDA批准的AI医疗设备数量（1955-2023）

3. 企业对AI的投入创历史新高

2024年，美国私营部门在AI领域的投资达到1091亿美元，几乎是中国的12倍，而与英国相比更是高出24倍。生成式AI的投资尤为强劲，全球范围内的私营投资达到339亿美元，比2023年增长了18.7%。同时，78%的组织报告他们正在使用AI，较上一年增长了55%。越来越多的研究表明，AI有助于提高生产效率，缩小劳动力中技能的差距。

图：2017-2024年，各所在职能中至少使用AI的受访者比例

4. 中国在顶级AI模型研发上缩小与美国的差距

尽管在2024年，美国推出了40个引人注目的AI模型，数量远超中国的15个和欧洲的3个，但中国模型的质量正在迅速接近。关键基准测试中，中国在MMLU和HumanEval等测试中的表现差距大幅缩小。同时，AI相关出版和专利方面，中国继续处于领先地位。而模型开发的全球化趋势愈发明显，中东、拉丁美洲和东南亚等地区纷纷推出诸多新模型。

图：美国顶级模型与中国顶级模型在LMSYS聊天机器人竞技场中的表现

5. 负责任的AI生态系统在发展但进展不均

尽管与人工智能相关的事件激增，主要工业模型开发商中标准化的负责任人工智能（RAI）评估仍较为匮乏。然而，新基准的出现如HELM Safety、AIR-Bench和FACTS，为评估安全性和事实性提供了有希望的工具。在企业中，识别RAI风险与采取实质性行动之间仍存在差距。相比之下，政府机构展现出更强的应对意愿，2024年全球范围内，包括经合组织、欧盟及联合国在内多方组织加强了合作，制定了关于透明性、可信度及基本RAI原则的框架。

图：已发布的针对热门基础模型的安全性和负责任AI基准

6. 全球对AI的乐观情绪上升，但地区间依旧存在分歧

在中国（83%）、印度尼西亚（80%）和泰国（77%）等国，大多数民众认为人工智能产品与服务的利益多于弊端。然而，加拿大（40%）、美国（39%）和荷兰（36%）的乐观情绪却远低于其他国家。最近几年的变化显著，自2022年以来，包括德国（+10%）、法国（+10%）、加拿大（+8%）、英国（+8%）及美国（+4%）在内的一些原本较为怀疑的国家表现出的乐观情绪显著增长。

图：2022-2024年，按国家划分认为“使用AI的产品和服务利大于弊”的比例

7. AI变得更加高效、经济且易于获取

得益于小型模型的强大能力，从2022年11月至2024年10月，达到GPT-3.5水平的系统推理成本下降了280倍。在硬件方面，成本每年减少30%，能效提升40%。开放权重模型与封闭模型的性能差距也在缩小，某些基准测试中的性能差异从8%缩减至仅1.7%。这些趋势迅速降低了先进人工智能的准入门槛。

图：2022-2024年，MMLU中得分超过60%的最小规模AI模型

8. 各国政府加强AI监管与投资

在2024年，美国联邦机构推出了59项与AI相关的法案，是2023年发布数量的两倍。全球范围内，自2023年起，涉及AI立法的国家在提及条款方面增长了21.3%，自2016年起增长达9倍。与此同时，各国政府加大投资力度，加拿大承诺24亿美元，中国启动475亿美元的半导体基金，法国计划投资1090亿欧元，印度承诺12.5亿美元，沙特阿拉伯也发起了一项高达1000亿美元的倡议。

图：部分供应商的顶尖模型在LMSYS聊天机器人竞技场中的表现

9. AI与计算机科学教育在扩展，但普及度仍不敷

如今，大约三分之二的国家提供或计划提供K-12计算机科学课程，这一数字是2019年的两倍，特别是在非洲和拉丁美洲进展较为显著。在美国，计算机科学学士学位的毕业生数近十年来增长了22%。不过，在许多非洲国家，由于基础设施问题，如电力供应不足，获得计算机学位的机会依然有限。调查显示，81%的美国K-12计算机科学教师认为 AI 应该成为计算机科学教育的核心内容，但不超过一半的教师自信能够教授AI的相关知识。

10. 工业界依然主导领域发展

在2024年，接近90%的顶尖AI模型源自工业界，较2023年的60%大幅提升，而学术界依旧是高引用率研究的主力。模型规模持续增长——每五个月训练计算翻一番，每八个月数据集翻一番，电力消耗年年翻倍。然而，模型之间的性能差距正在缩小：排名第一与第十的模型在得分上只相差5.4%，前两名模型之间的差距缩小至0.7%。前沿领域的竞争愈发激烈。

图：AlphaFold 3与用于蛋白质-配体对接的基线方法的性能对比

11. AI因其对科学的推动作用而备受称赞

随着人工智能在科学研究中的重要性愈加凸显，多项大奖向其致以了荣耀。两项诺贝尔奖分别表彰了在深度学习（物理学）及蛋白质折叠（化学）研究中的AI应用，而图灵奖则认可了AI在强化学习方面开创性的贡献。

图：PlanBench基准下正确实例数量的对比

12. 复杂推理依然是一大挑战

尽管AI模型在国际数学奥林匹克问题等挑战中表现优异，如PlanBench等复杂推理基准却仍是其短板。即便存在可被证明的正确解答，它们在确保逻辑任务的一致性与可靠性上仍面临困难，这限制了其在高风险环境中的应用。

附录：致AI Index联合主任Yolanda Gil与Raymond Perrault的一封信

随着人工智能技术不断改变我们的生活、商业及社会议题，AI Index将继续追踪这一领域的进展，为公众呈现独立、数据驱动的视角，涵盖全球范围内的人工智能发展、应用与影响。

2024年对于人工智能而言是辉煌的一年。诺贝尔奖及图灵奖的颁发，标志着人工智能在推进科学知识方面的重要性。而图灵测试这一曾难以攀登的高峰，如今已不再被视为难题，现代系统已然超越了这一标准。同时，AI的应用正在以前所未有的速度普及，成千上万的人在职业与日常生活中频繁使用这一技术。随着高效、低成本及开放模型的普及，人工智能的可获取性及影响力将愈发广泛。

经历短暂的放缓后，企业在人工智能领域的投资显著增长，尤其是生成式AI初创公司，其近期融资数量几乎翻倍，在经历多年低迷后，人工智能的商业应用年度增长显著。曾经处于边缘的人工智能，如今已逐步成为推动商业发展的核心力量。

各国政府也开始增强参与。政策制定者们不再只是讨论AI，而是开始积极投资其中。一些国家启动了数十亿美元的人工智能基础设施计划，进行能源能力扩展，以支持AI的发展。全球范围内的协调不断加强，地方层面的倡议也逐渐形成规模。

然而，信任依然是一个显著的挑战。越来越多的人对人工智能公司保护个人数据的能力产生怀疑，公平性与偏见危机仍旧困扰着公众。错误信息尤其在选举及深度伪造横行的环境中显得尤为严峻。对此，各国政府正在推动新的监管框架，强调透明度、问责与公平。同时，公众态度也在悄然变化。尽管仍存怀疑，但2024年的全球调查显示，民众对人工智能带来的广泛社会效益的潜在乐观情绪正在显著上升。

人工智能不再是关于潜力的故事，而是真实发生的变化，以及我们如何共同塑造未来的故事。