2025年人工智能指数报告:12大趋势标志AI已超越可能

刚刚发布的《2025年人工智能指数报告》由斯坦福大学的以人为本人工智能研究所(Stanford HAI)共同领导的李飞飞教授团队编辑。这份报告总计超过456页,是该所第八次发布的AI Index研究,旨在全面追踪2024年全球人工智能领域的最新发展动向。

此次报告不仅涵盖了AI硬件进展的深度探讨,还对推理成本进行了全新的评估,分析了人工智能出版物和专利申请的动态。此外,新数据也揭示了企业在实施负责任AI实践方面的最新进展,突显了人工智能在科学与医疗领域中日渐重要的角色。

完整报告请参考:AI Index Report 2025

在其官网上,斯坦福HAI表示:“人工智能对社会的影响前所未有地显著......2025年的报告是我们迄今为止所做的最为广泛且重要的研究。”

该研究所也指出,“人工智能将会是21世纪最具颠覆性的科技之一。然而,唯有通过审慎的引导,才能确保这一技术能惠及大众。”

新报告中提出了2024年度人工智能领域的十二大趋势:

1. AI的性能在严苛基准下持续提升

2023年,研究者们提出了新的测试基准——MMMU、GPQA以及SWE-bench,以考察高级人工智能系统的极限。一年的时间内,AI在这些基准测试中的得分分别提高了18.8%、48.9%和67.3%。在生成高质量视频方面,AI系统也取得了显著的突破。在某些情况下,语言模型智能体在编程任务中表现已超越人类。

图:选定的AI指数技术性能基准与人类表现的对比

2. AI逐步融入日常生活

人工智能正在迅速从实验室走进我们的生活。从健康医疗到交通运输,2023年FDA批准了223种AI医疗设备,而在2015年这一数字仅为6种。自动驾驶汽车已不再是实验性技术,美国最大的运营商Waymo每周提供超过15万次自动驾驶出行,百度的“萝卜快跑”(Apollo Go)出租车也在中国的多个城市投入服务。

图:FDA批准的AI医疗设备数量(1955-2023)

3. 企业对AI的投入创历史新高

2024年,美国私营部门在AI领域的投资达到1091亿美元,几乎是中国的12倍,而与英国相比更是高出24倍。生成式AI的投资尤为强劲,全球范围内的私营投资达到339亿美元,比2023年增长了18.7%。同时,78%的组织报告他们正在使用AI,较上一年增长了55%。越来越多的研究表明,AI有助于提高生产效率,缩小劳动力中技能的差距。

图:2017-2024年,各所在职能中至少使用AI的受访者比例

4. 中国在顶级AI模型研发上缩小与美国的差距

尽管在2024年,美国推出了40个引人注目的AI模型,数量远超中国的15个和欧洲的3个,但中国模型的质量正在迅速接近。关键基准测试中,中国在MMLU和HumanEval等测试中的表现差距大幅缩小。同时,AI相关出版和专利方面,中国继续处于领先地位。而模型开发的全球化趋势愈发明显,中东、拉丁美洲和东南亚等地区纷纷推出诸多新模型。

图:美国顶级模型与中国顶级模型在LMSYS聊天机器人竞技场中的表现

5. 负责任的AI生态系统在发展但进展不均

尽管与人工智能相关的事件激增,主要工业模型开发商中标准化的负责任人工智能(RAI)评估仍较为匮乏。然而,新基准的出现如HELM Safety、AIR-Bench和FACTS,为评估安全性和事实性提供了有希望的工具。在企业中,识别RAI风险与采取实质性行动之间仍存在差距。相比之下,政府机构展现出更强的应对意愿,2024年全球范围内,包括经合组织、欧盟及联合国在内多方组织加强了合作,制定了关于透明性、可信度及基本RAI原则的框架。

图:已发布的针对热门基础模型的安全性和负责任AI基准

6. 全球对AI的乐观情绪上升,但地区间依旧存在分歧

在中国(83%)、印度尼西亚(80%)和泰国(77%)等国,大多数民众认为人工智能产品与服务的利益多于弊端。然而,加拿大(40%)、美国(39%)和荷兰(36%)的乐观情绪却远低于其他国家。最近几年的变化显著,自2022年以来,包括德国(+10%)、法国(+10%)、加拿大(+8%)、英国(+8%)及美国(+4%)在内的一些原本较为怀疑的国家表现出的乐观情绪显著增长。

图:2022-2024年,按国家划分认为“使用AI的产品和服务利大于弊”的比例

7. AI变得更加高效、经济且易于获取

得益于小型模型的强大能力,从2022年11月至2024年10月,达到GPT-3.5水平的系统推理成本下降了280倍。在硬件方面,成本每年减少30%,能效提升40%。开放权重模型与封闭模型的性能差距也在缩小,某些基准测试中的性能差异从8%缩减至仅1.7%。这些趋势迅速降低了先进人工智能的准入门槛。

图:2022-2024年,MMLU中得分超过60%的最小规模AI模型

8. 各国政府加强AI监管与投资

在2024年,美国联邦机构推出了59项与AI相关的法案,是2023年发布数量的两倍。全球范围内,自2023年起,涉及AI立法的国家在提及条款方面增长了21.3%,自2016年起增长达9倍。与此同时,各国政府加大投资力度,加拿大承诺24亿美元,中国启动475亿美元的半导体基金,法国计划投资1090亿欧元,印度承诺12.5亿美元,沙特阿拉伯也发起了一项高达1000亿美元的倡议。

图:部分供应商的顶尖模型在LMSYS聊天机器人竞技场中的表现

9. AI与计算机科学教育在扩展,但普及度仍不敷

如今,大约三分之二的国家提供或计划提供K-12计算机科学课程,这一数字是2019年的两倍,特别是在非洲和拉丁美洲进展较为显著。在美国,计算机科学学士学位的毕业生数近十年来增长了22%。不过,在许多非洲国家,由于基础设施问题,如电力供应不足,获得计算机学位的机会依然有限。调查显示,81%的美国K-12计算机科学教师认为 AI 应该成为计算机科学教育的核心内容,但不超过一半的教师自信能够教授AI的相关知识。

10. 工业界依然主导领域发展

在2024年,接近90%的顶尖AI模型源自工业界,较2023年的60%大幅提升,而学术界依旧是高引用率研究的主力。模型规模持续增长——每五个月训练计算翻一番,每八个月数据集翻一番,电力消耗年年翻倍。然而,模型之间的性能差距正在缩小:排名第一与第十的模型在得分上只相差5.4%,前两名模型之间的差距缩小至0.7%。前沿领域的竞争愈发激烈。

图:AlphaFold 3与用于蛋白质-配体对接的基线方法的性能对比

11. AI因其对科学的推动作用而备受称赞

随着人工智能在科学研究中的重要性愈加凸显,多项大奖向其致以了荣耀。两项诺贝尔奖分别表彰了在深度学习(物理学)及蛋白质折叠(化学)研究中的AI应用,而图灵奖则认可了AI在强化学习方面开创性的贡献。

图:PlanBench基准下正确实例数量的对比

12. 复杂推理依然是一大挑战

尽管AI模型在国际数学奥林匹克问题等挑战中表现优异,如PlanBench等复杂推理基准却仍是其短板。即便存在可被证明的正确解答,它们在确保逻辑任务的一致性与可靠性上仍面临困难,这限制了其在高风险环境中的应用。

附录:致AI Index联合主任Yolanda Gil与Raymond Perrault的一封信

随着人工智能技术不断改变我们的生活、商业及社会议题,AI Index将继续追踪这一领域的进展,为公众呈现独立、数据驱动的视角,涵盖全球范围内的人工智能发展、应用与影响。

2024年对于人工智能而言是辉煌的一年。诺贝尔奖及图灵奖的颁发,标志着人工智能在推进科学知识方面的重要性。而图灵测试这一曾难以攀登的高峰,如今已不再被视为难题,现代系统已然超越了这一标准。同时,AI的应用正在以前所未有的速度普及,成千上万的人在职业与日常生活中频繁使用这一技术。随着高效、低成本及开放模型的普及,人工智能的可获取性及影响力将愈发广泛。

经历短暂的放缓后,企业在人工智能领域的投资显著增长,尤其是生成式AI初创公司,其近期融资数量几乎翻倍,在经历多年低迷后,人工智能的商业应用年度增长显著。曾经处于边缘的人工智能,如今已逐步成为推动商业发展的核心力量。

各国政府也开始增强参与。政策制定者们不再只是讨论AI,而是开始积极投资其中。一些国家启动了数十亿美元的人工智能基础设施计划,进行能源能力扩展,以支持AI的发展。全球范围内的协调不断加强,地方层面的倡议也逐渐形成规模。

然而,信任依然是一个显著的挑战。越来越多的人对人工智能公司保护个人数据的能力产生怀疑,公平性与偏见危机仍旧困扰着公众。错误信息尤其在选举及深度伪造横行的环境中显得尤为严峻。对此,各国政府正在推动新的监管框架,强调透明度、问责与公平。同时,公众态度也在悄然变化。尽管仍存怀疑,但2024年的全球调查显示,民众对人工智能带来的广泛社会效益的潜在乐观情绪正在显著上升。

人工智能不再是关于潜力的故事,而是真实发生的变化,以及我们如何共同塑造未来的故事。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值