2025 AI深度前瞻:推理成本暴降90%,智能体迎GPT时刻,空间智能涌现

76fb192e1a291dfdbe84715ecd921b46.jpeg

来源:智东西

2025 AI趋势展望。

走出最后一个AI寒冬,21世纪第三个十年见证了现代AI的诞生。

斯坦福大学教授、“AI教母”李飞飞将当前AI领域的变化描述为科技领域的“寒武纪大爆发”。回顾过去一年,Scaling Law驱动的新范式开始告别参数规模崇拜;多模态AI生成能力涌现多个爆款应用,打开了全新的竞速空间,也为即将到来的2025年带来了诸多可能性。

12月,微软亚洲研究院、中金研究、红杉资本、Wired等发布了多份新年技术趋势展望报告,其中端侧大模型、智能代理等成为多个机构加注的焦点,值得行业长期关注。

01.

计算成本呈每年十倍速下降,大模型向端侧及边缘侧落地

  • 计算成本显著下降

目前,动辄数十亿美金的计算资源投入和昂贵的推理费用正在削弱生成式人工智能的创新能力。为了实现新的技术突破,大型语言模型(LLM)迫切需要变得更加精简、效率更高、成本更低。在《WIRED》杂志的《2025年趋势展望》特刊中,李开复博士预计,2025年将成为一个关键的转变点,届时将有大量以AI为核心的应用出现,这些应用将得益于性能卓越但更加经济的模型。

2dab57a51a43f96f52b30ec4660c36b0.jpeg

李开复博士认为,当前硅谷巨头如OpenAI、谷歌、xAI等公司不惜重金的投入造就了一个不均衡的生态。由庞大的GPU集群训练出的大模型,推理成本高昂,最终会转嫁到所有使用这些大模型的应用上。这种失衡生态使英伟达成为最大受益者,同时也让应用开发者面临艰难抉择:要么只能使用低成本、低性能的模型,但这显然无法满足用户期望;要么承担高昂的推理成本,冒着极大的风险开发应用。

李开复博士预测,到2025年,一种新模式将有望打破这一僵局——随着新一代人工智能算法的优化、更先进推理技术以及更具成本效益芯片技术的发展,AI推理成本有望实现每年十倍的降低。

  • 端侧应用将迎爆发

随着计算成本的大幅降低,更轻便的终端应用将迅速增长。东兴证券的研究报告指出,人工智能终端市场潜力巨大,覆盖了个人电脑、智能手机、可穿戴设备等多个领域,人工智能终端在短期、中期和长期均显示出明显的增长趋势。

在AI PC领域,传统PC的普及率已接近饱和状态,而AI PC通过提供智能化体验可能会开辟新的增长机会。根据IDC的预测,AI PC在中国PC市场的新设备中所占的比例将在接下来的几年内迅速上升,预计到2027年将达到85%,成为市场的主导力量。

在AI手机领域,据中国报告大厅的分析预测,2024年搭载AI功能的手机渗透率有望增至16%,而到了2026年,AI 手机的出货量预计将突破4.7亿部,渗透率增至38%。AI大模型与智能手机的结合有望激发新的换机浪潮,推动整个行业的发展趋势。

在AI可穿戴设备领域,市场规模预计将从2024年的419亿美元增长至2028年的1207亿美元,CAGR达到30.3%。增长主要得益于消费者对可穿戴设备兴趣的显著提升、与智能手机的进一步整合、医疗健康应用的扩展以及针对老年人护理的可穿戴设备的开发等因素。年末,智能轻奢品牌BUTTONS与AIoT企业特斯联合作打造的首款智能体耳机,硅谷明星创企Friend AI智能项链的量产均印证了智能可穿戴设备的爆发趋势。

9381743fbd3dc1f65d92919e30ee80ec.jpeg

  • 边缘计算市场持续扩张

大语言模型轻量化、实惠化趋势之下,边缘计算市场亦将迎来进一步扩张。不久前,我国信通院发布了《边缘计算产业发展研究报告(2024年)》。《报告》指出,我国的边缘计算市场处于稳步增长阶段,自2020年以来,边缘计算市场快速扩张,多年年均增长率超过40%。

2024年6月,由特斯联与中科院重庆研究院合作共建的重庆首个省级“边缘智能计算重庆市重点实验室”正式落地重庆高新区。该实验室即旨在围绕边缘智能与计算服务等场景开展全方位科研合作。实验室副主任、特斯联首席科学家杨旸博士在揭牌仪式上提出,随着5G技术的发展,及其所支持的物联网场景的发展,数据风暴业已冲击到越来越多的用户——通信网络有越来越多的数据无法上传;网络阻塞导致了越来越惨的服务时延。这使得边缘智能的重要性凸显。

据实验室管理委员会委员、特斯联高级副总裁刘斌博士透露,作为我国AIoT行业的代表企业,特斯联亦在持续通过边缘智能计算,推动大模型在边缘侧及端侧的落地。“针对边缘,特斯联打造了系列边缘计算产品,目前已经可以部署10B规模、百亿级的大模型。端侧大模型、边缘侧大模型、云端大模型,根据不同场景分别部署、协同,将能解决不同客户,不同场景的不同需求。

02.

多模态释放无限可能,AI Agent或将诞生爆款应用

  • 打破数据模态壁垒,生成式AI释放无限前景

尽管大模型打开了AI向前发展的诸多象限,然而值得注意的是,当前头部AI企业仍面临着不小的盈利压力。商业化承压之下,头部AI企业纷纷开始“推陈出新”,以寻求破局之道。一方面,OpenAI于9月发布了o1推理(Reasoning)模型系列。o1采用了全新的基于思维链的强化学习训练技术。这种训练方式使得o1模型在面对需要多层次推理的任务时,能够展现出与人类专家相当的表现。通过强化学习,o1模型学会了如何完善自己的思维过程,尝试不同策略,并认识到自己的错误,从而不断提升其推理能力。

另一方面,越来越多的企业正在尝试利用人工智能技术,实现不同模态数据间的相互理解和转换。谷歌云日前发布《2025年人工智能商业趋势报告》指出,多模态AI模型能够处理来自文本、图像、音频和视频的信息——这与人类的大脑非常相似。报告认为,这将实现更直观的交互,并提高AI输出的准确性。报告预测,2025年将是企业AI采用的关键一年,这在很大程度上是由多模态学习和它所提供的环境感知能力推动的,同时预计2025年全球多模态AI市场规模将达到24亿美元。

c57e4e201fbc730cebd43e8ce05165f9.jpeg

这一趋势推动下,多模态在金融、医疗、营销、工业、娱乐等多个领域都将迎来更广阔的应用。例如,在医疗领域,多模态AI可以通过整合医学影像、文本信息(如病历)、病理报告等多种数据,辅助医生进行更全面、准确的临床决策;在个性化营销领域,多模态AI能够提供更深入的消费者洞察,帮助品牌实现“千人千面”的个性化营销策略,提升用户体验和满意度,同时AI技术通过分析用户的历史数据和行为模式,预测用户的兴趣和需求,实现个性化推荐,提高转化率……

  • AI Agent进入商业及消费级场景

多模态灵活转换背景下,AI应用业已从聊天机器人进化到能够处理复杂工作流程的Copilot及AI Agent(智能代理/智能体),对智能时代的生产关系进行着深刻重塑。

1c08a244051423e8b4f4b76c45e91db3.jpeg

在2024年11月落下帷幕的科技盛会Web Summit上,AI Agent亦成为多家智能企业、多位智能产业领袖的讨论焦点。高通总裁克里斯蒂亚诺·阿蒙(Cristiano Amon)在峰会现场指出,AI驱动的智能体将成为人类充分利用AI带来全新机会的关键所在。阿里国际总裁张阔则在峰会重磅发布了阿里国际的B2B AI搜索智能体Accio。“用户可通过“大白话”来询问AI、提出需求,Accio会通过多轮对话,梳理用户需求,并像一位真正的代理商一样,通过专业的B2B行业知识拆解需求、给出建议。”

9d0259ef5e3e91a016921217a1cd0cc3.jpeg

特斯联创始人兼CEO艾渝则将AI Agent的触角延伸至消费场景。他在Web Summit的中央舞台发布了由特斯联与BUTTONS联合打造的第一代通用智能体Hali,并将Hali区别于普通生成式AI/大模型的特点总结为:类人思考能力、长期记忆能力、高维感知能力及多智能体协同能力,其通过可穿戴设备实现与用户的实时交互及与其他智能体的无缝协作,成为用户的助理乃至伴侣。

  • 智能体呈生态化、集群化趋势

2024常被称为“智能体元年”,无论是日益深入垂直行业场景的To B智能体,还是与消费电子产品紧密绑定的To C智能体,多智能体协同已成为显著趋势。根据Grand View Research的数据,尽管单一智能体系统在2023年仍然占据了最大的市场份额,然而多智能体系统细分市场预计在2024-2030间将展现出最高的复合年增长率。

艾渝在Web Summit舞台亦分享了其对MAS(Multi-Agent System,多智能体系统)趋势的观察。在他看来,未来世界,智能体的数量或将远超人类数量,每个智能体均具备像人类一样的行动以及思考能力,同时,还能够成为某垂直领域的专家。在这样的前提下,一个能够统筹、协调所有智能体,完成与人类交互的超级通用智能体(AGI Agent)就显得尤为重要。

通用智能体能够依据workflow无代码生成多个智能体;同时,基于其背后大模型的思考、规划能力,通用智能体能够实现对多个智能体的统一调度、编排。用户通过与通用智能体的简单语言交互,即可获得一整套多智能体协同的系统,从而完成导航、翻译、活动管理、商业分析等诸多任务。

194c26150200e8dd64cd4b6df23a3dac.jpeg

同样是2024年11月,“Microsoft Ignite 2024”全球开发者大会则公布了微软智能体生态的发展状况。据透露,自推出以来,已有超过10万家组织通过其Copilot Studio创建或编辑过智能体。Copilot Studio集成了1400多种企业系统和数据源,范围从SAP到ServiceNow、再到SQL数据库。智能体生态的快速生长,使得企业在智能体间无缝协作成为可能。

03.

视觉空间智能将迎全新突破

此外值得注意的是,当前生成式AI的多模态泛化仍基于语言,而视觉空间智能有望在2025年实现进一步突破。

24年4月,斯坦福大学教授李飞飞与联合创始人Justin Johnson正式推出了他们的创业公司World Labs,专注于空间智能领域。在接受媒体采访中,李飞飞表示,空间智能与语言同样重要,是AI的根基之一。李飞飞定义了AI的终极目标,即赋予机器在三维空间中感知、推理和行动的能力,她将其称为“空间智能”,并强调,未来的AI不仅要理解文本和图像,还必须能够在现实世界中进行复杂的交互,这正是World Labs的使命所在。

7dc4cb1894d48ebf304ffa2c525cd099.jpeg

据全球市场调研机构Omdia报告显示,2024年,全球空间计算市场规模达45亿美元,并预计到2029年将超过100亿美元,复合增长率达18%。

2024年底,World Labs推出了其首个空间智能AI模型,Large World Model。该模型能够将AI模型从2D像素平面提升到完整的3D世界(包括虚拟和现实世界),赋予人工智能生成、推理和与三维世界互动的能力。据World Labs透露,该司计划在2025年基于Large World Model推出首款产品,支持AR、机器人、自动驾驶等领域。

展望2025,空间智能或许将在当前以语言模型为主导的智能产业场域打开全新竞速赛道,为AI在应用侧的发展带来除Copilot、AI Agent之外的第三种答案。新的一年会否诞生新的架构、新的模型?大模型极尽压缩后将催生怎样的全新场景?异构智能体的协同将产生怎样的火花?有待时间作进一步解答。

(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

548b2d7fab04705089dc0443700e2e2d.jpeg

未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828 进入。

4cb40666a10ab4168bc49cf148ea66db.jpeg

截止到12月25日 ”未来知识库”精选的100部前沿科技趋势报告

  1. 2024 美国众议院人工智能报告:指导原则、前瞻性建议和政策提案

  2. 未来今日研究所:2024 技术趋势报告 - 移动性,机器人与无人机篇

  3. Deepmind:AI 加速科学创新发现的黄金时代报告

  4. Continental 大陆集团:2024 未来出行趋势调研报告

  5. 埃森哲:未来生活趋势 2025

  6. 国际原子能机构 2024 聚变关键要素报告 - 聚变能发展的共同愿景

  7. 哈尔滨工业大学:2024 具身大模型关键技术与应用报告

  8. 爱思唯尔(Elsevier):洞察 2024:科研人员对人工智能的态度报告

  9. 李飞飞、谢赛宁新作「空间智能」 等探索多模态大模型性能

  10. 欧洲议会:2024 欧盟人工智能伦理指南:背景和实施

  11. 通往人工超智能的道路:超级对齐的全面综述

  12. 清华大学:理解世界还是预测未来?世界模型综合综述

  13. Transformer 发明人最新论文:利用基础模型自动搜索人工生命

  14. 兰德公司:新兴技术监督框架发展的现状和未来趋势的技术监督报告

  15. 麦肯锡全球研究院:2024 年全球前沿动态(数据)图表呈现

  16. 兰德公司:新兴技术领域的全球态势综述

  17. 前瞻:2025 年人形机器人产业发展蓝皮书 - 人形机器人量产及商业化关键挑战

  18. 美国国家标准技术研究院(NIST):2024 年度美国制造业统计数据报告(英文版)

  19. 罗戈研究:2024 决策智能:值得关注的决策革命研究报告

  20. 美国航空航天专家委员会:2024 十字路口的 NASA 研究报告

  21. 中国电子技术标准化研究院 2024 扩展现实 XR 产业和标准化研究报告

  22. GenAI 引领全球科技变革关注 AI 应用的持续探索

  23. 国家低空经济融创中心中国上市及新三板挂牌公司低空经济发展报告

  24. 2025 年计算机行业年度策略从 Infra 到 AgentAI 创新的无尽前沿

  25. 多模态可解释人工智能综述:过去、现在与未来

  26. 【斯坦福博士论文】探索自监督学习中对比学习的理论基础

  27. 《机器智能体的混合认知模型》最新 128 页

  28. Open AI 管理 AI 智能体的实践

  29. 未来生命研究院 FLI2024 年 AI 安全指数报告 英文版

  30. 兰德公司 2024 人工智能项目失败的五大根本原因及其成功之道 - 避免 AI 的反模式 英文版

  31. Linux 基金会 2024 去中心化与人工智能报告 英文版

  32. 脑机接口报告脑机接口机器人中的人机交换

  33. 联合国贸发会议 2024 年全球科技创新合作促发展研究报告 英文版

  34. Linux 基金会 2024 年世界开源大会报告塑造人工智能安全和数字公共产品合作的未来 英文版

  35. Gartner2025 年重要战略技术趋势报告 英文版

  36. Fastdata 极数 2024 全球人工智能简史

  37. 中电科:低空航行系统白皮书,拥抱低空经济

  38. 迈向科学发现的生成式人工智能研究报告:进展、机遇与挑战

  39. 哈佛博士论文:构建深度学习的理论基础:实证研究方法

  40. Science 论文:面对 “镜像生物” 的风险

  41. 镜面细菌技术报告:可行性和风险

  42. Neurocomputing 不受限制地超越人类智能的人工智能可能性

  43. 166 页 - 麦肯锡:中国与世界 - 理解变化中的经济联系(完整版)

  44. 未来生命研究所:《2024 人工智能安全指数报告》

  45. 德勤:2025 技术趋势报告 空间计算、人工智能、IT 升级。

  46. 2024 世界智能产业大脑演化趋势报告(12 月上)公开版

  47. 联邦学习中的成员推断攻击与防御:综述

  48. 兰德公司 2024 人工智能和机器学习在太空领域感知中的应用 - 基于两项人工智能案例英文版

  49. Wavestone2024 年法国工业 4.0 晴雨表市场趋势与经验反馈 英文版

  50. Salesforce2024 年制造业趋势报告 - 来自全球 800 多位行业决策者对运营和数字化转型的洞察 英文版

  51. MicrosoftAzure2024 推动应用创新的九大 AI 趋势报告

  52. DeepMind:Gemini,一个高性能多模态模型家族分析报告

  53. 模仿、探索和自我提升:慢思维推理系统的复现报告

  54. 自我发现:大型语言模型自我组成推理结构

  55. 2025 年 101 项将 (或不会) 塑造未来的技术趋势白皮书

  56. 《自然杂志》2024 年 10 大科学人物推荐报告

  57. 量子位智库:2024 年度 AI 十大趋势报告

  58. 华为:鸿蒙 2030 愿景白皮书(更新版)

  59. 电子行业专题报告:2025 年万物 AI 面临的十大待解难题 - 241209

  60. 中国信通院《人工智能发展报告(2024 年)》

  61. 美国安全与新兴技术中心:《追踪美国人工智能并购案》报告

  62. Nature 研究报告:AI 革命的数据正在枯竭,研究人员该怎么办?

  63. NeurIPS 2024 论文:智能体不够聪明怎么办?让它像学徒一样持续学习

  64. LangChain 人工智能代理(AI agent)现状报告

  65. 普华永道:2024 半导体行业状况报告发展趋势与驱动因素

  66. 觅途咨询:2024 全球人形机器人企业画像与能力评估报告

  67. 美国化学会 (ACS):2024 年纳米材料领域新兴趋势与研发进展报告

  68. GWEC:2024 年全球风能报告英文版

  69. Chainalysis:2024 年加密货币地理报告加密货币采用的区域趋势分析

  70. 2024 光刻机产业竞争格局国产替代空间及产业链相关公司分析报告

  71. 世界经济论坛:智能时代,各国对未来制造业和供应链的准备程度

  72. 兰德:《保护人工智能模型权重:防止盗窃和滥用前沿模型》-128 页报告

  73. 经合组织 成年人是否具备在不断变化的世界中生存所需的技能 199 页报告

  74. 医学应用中的可解释人工智能:综述

  75. 复旦最新《智能体模拟社会》综述

  76. 《全球导航卫星系统(GNSS)软件定义无线电:历史、当前发展和标准化工作》最新综述

  77. 《基础研究,致命影响:军事人工智能研究资助》报告

  78. 欧洲科学的未来 - 100 亿地平线研究计划

  79. Nature:欧盟正在形成一项科学大型计划

  80. Nature 欧洲科学的未来

  81. 欧盟科学 —— 下一个 1000 亿欧元

  82. 欧盟向世界呼吁 加入我们价值 1000 亿欧元的研究计划

  83. DARPA 主动社会工程防御计划(ASED)《防止删除信息和捕捉有害行为者(PIRANHA)》技术报告

  84. 兰德《人工智能和机器学习用于太空域感知》72 页报告

  85. 构建通用机器人生成范式:基础设施、扩展性与策略学习(CMU 博士论文)

  86. 世界贸易组织 2024 智能贸易报告 AI 和贸易活动如何双向塑造 英文版

  87. 人工智能行业应用建设发展参考架构

  88. 波士顿咨询 2024 年欧洲天使投资状况报告 英文版

  89. 2024 美国制造业计划战略规划

  90. 【新书】大规模语言模型的隐私与安全

  91. 人工智能行业海外市场寻找 2025 爆款 AI 应用 - 241204

  92. 美国环保署 EPA2024 年版汽车趋势报告英文版

  93. 经济学人智库 EIU2025 年行业展望报告 6 大行业的挑战机遇与发展趋势 英文版

  94. 华为 2024 迈向智能世界系列工业网络全连接研究报告

  95. 华为迈向智能世界白皮书 2024 - 计算

  96. 华为迈向智能世界白皮书 2024 - 全光网络

  97. 华为迈向智能世界白皮书 2024 - 数据通信

  98. 华为迈向智能世界白皮书 2024 - 无线网络

  99. 安全牛 AI 时代深度伪造和合成媒体的安全威胁与对策 2024 版

  100. 2024 人形机器人在工业领域发展机遇行业壁垒及国产替代空间分析报告

  101. 《2024 年 AI 现状分析报告》2-1-3 页.zip

  102. 万物智能演化理论,智能科学基础理论的新探索 - newv2

  103. 世界经济论坛 智能时代的食物和水系统研究报告

  104. 生成式 AI 时代的深伪媒体生成与检测:综述与展望

  105. 科尔尼 2024 年全球人工智能评估 AIA 报告追求更高层次的成熟度规模化和影响力英文版

  106. 计算机行业专题报告 AI 操作系统时代已至 - 241201

  107. Nature 人工智能距离人类水平智能有多近?

  108. Nature 开放的人工智能系统实际上是封闭的

  109. 斯坦福《统计学与信息论》讲义,668 页 pdf

  110. 国家信息中心华为城市一张网 2.0 研究报告 2024 年

  111. 国际清算银行 2024 生成式 AI 的崛起对美国劳动力市场的影响分析报告 渗透度替代效应及对不平等状况英文版

  112. 大模型如何判决?从生成到判决:大型语言模型作为裁判的机遇与挑战

  113. 毕马威 2024 年全球半导体行业展望报告

  114. MR 行业专题报告 AIMR 空间计算定义新一代超级个人终端 - 241119

  115. DeepMind 36 页 AI4Science 报告:全球实验室被「AI 科学家」指数级接管

  116. 《人工智能和机器学习对网络安全的影响》最新 273 页

  117. 2024 量子计算与人工智能无声的革命报告

  118. 未来今日研究所:2024 技术趋势报告 - 广义计算篇

  119. 科睿唯安中国科学院 2024 研究前沿热度指数报告

  120. 文本到图像合成:十年回顾

  121. 《以人为中心的大型语言模型(LLM)研究综述》

  122. 经合组织 2024 年数字经济展望报告加强连通性创新与信任第二版

  123. 波士顿咨询 2024 全球经济体 AI 成熟度矩阵报告 英文版

  124. 理解世界还是预测未来?世界模型的综合综述

  125. GoogleCloudCSA2024AI 与安全状况调研报告 英文版

  126. 英国制造商组织 MakeUK2024 英国工业战略愿景报告从概念到实施

  127. 花旗银行 CitiGPS2024 自然环境可持续发展新前沿研究报告

  128. 国际可再生能源署 IRENA2024 年全球气候行动报告

  129. Cell: 物理学和化学 、人工智能知识领域的融合

  130. 智次方 2025 中国 5G 产业全景图谱报告

上下滑动查看更多

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值