从训练到推理,AI 大模型发展有哪五大趋势?

电子发烧友网报道(文/章鹰)2024年两会召开后,两会报告把加快发展新质生产力列为十大任务举措之首。新质生产力的核心是用新技术促进产业高端化、智能化和绿色化。ICT产业是发展新质生产力的核心支撑要求,ICT产业正在进入AI无处不在的大转型阶段。

纵观全球,2024年中国GDP增长预期5%,全球平均增长率达到2.6%,美国预期增长2%,印度最为乐观预期今年的GDP增长达到6.2%。从科教兴国的战略看,新质生产力主要涉及的是数字中国的底层基础技术,AI 无处不在,从2022年,ChateGPT3.5发布以来,全球掀起了生成式AI 的热潮。到了2024年,大家都在考虑生成式AI到底给企业带来了哪些价值。

IDC最新的调研显示,28%的受访者表示在过去投资了生成是AI不到一年时间就看到了投资回报,每投资1美元,平均可以获得3.5倍的投资回报,投资回报率最高的用例是自动化IT任务,达到46.5%,也有高达27.1%受访者选择产品与服务创新。AI大模型在使用当中,实际应用开发过程中,开源大模型和商业化模型同时并存,开发者更加倾向于使用开源模型。而且IDC调研显示,数据仓库作为生成式AI 的数据平台发挥着主导作用。

生成式AI支出在全球和中国有什么差异?2024年AI大模型将呈现哪些新的发展趋势?全球AI基础设施市场规模预测?4月6日,来自IDC中国区副总裁兼首席分析师武连峰和IDC中国区副总裁钟振山做了最新解读。

生成式AI在全球和中国高速增长


IDC中国区副总裁兼首席分析师武连峰表示,IDC预测,2024年全球生成式AI支出将会达到387.9亿美元,占整体AI比例为16.7%,未来到2027年,生成式AI的全球支持将达到1454.2亿美元,年复合增长率会达到55.3%。2024年,中国生成式AI支出将达到35.3亿美元,占整体AI比例达到16%,未来到2027年中国生成式AI支出预测将达到129.3亿美元。

武连峰指出,整体ICT市场从以增量市场为主转向以存量市场为主,存量市场是小幅度增长的特征,其中企业移动软件、IoT连接、可穿戴设备、移动数据服务增长率在10%以下,增量市场主要包括AI平台、机器人相关的OT服务、AI相关的商业服务等,增长率达到18%到40%之间。

AI大模型未来发展的五大趋势


IDC中国区副总裁钟振山表示,2024年AI大模型发展呈现五大趋势。一、中国基础大模型数量趋于收敛,2024年将卷向产业。去年发布的国内大通用大模型发布达到百款,今年我们调研发现更多面向行业或者场景的大模型出现,关注大模型在行业或者企业应用场景的落地,比如网易有道的子曰、好未来的MathGPT、孩子王的KidsGPT面向教育行业,蚂蚁集团推出贞仪、百灵面向金融,还有中科闻歌的雅意大模型面向媒体行业,京东的言犀ChatJD模型面向商业应用场景,加速AI大模型在行业场景的落地。

AI大模型趋势二、开源和闭源共存,共同促进大模型应用生态走向繁荣。钟振山表示,更多企业选择开源的AI大模型来构建自身的应用,现有的开源模型参数大多数是十亿到千亿之间,基于MoE架构的稀疏大模型参数可以达到万亿参数,微调和多种计算资源并行技术变得十分重要。他强调,AI 进入一个变革期,大家关注三个方向:第一、如何快速部署和开发模型;第二、大模型的压缩量化蒸馏;第三、如何搭建一套有效的开源生态,以及不同CPU、GPU和XPU的分配。

AI大模型趋势三、大模型向端侧转移,AI推理引起广泛关注。苹果计划推出更智能的Siri, 为端侧大模型生态做积极准备,国内手机厂商华为、小米、Vivo、OPPO和荣耀都推出了手机端大模型,华为手机适配盘古大模型,小米推出MiLM大模型,Vivo适配蓝心大模型,OPPO和荣耀分别推出了安第斯大模型和魔方大模型。AI推理将在手机、PC、耳机、音箱、XR、汽车,以及其他可穿戴新型终端上运行。

钟振山分析说,端侧大模型带来三大优势:1、本地数据处理效率更高,节省云端服务器带宽和算力成本;2、对用户数据可以形成更好的隐私保护;3、端侧大模型可以带来更多交互方式和新体验。

AI大模型趋势四、多模态发展可能会促进市场出现杀手级应用。现在生成式AI 主要在文本、视频、图像、音频领域应用。GPT是基于自然语言技术,对话聊天机器人已经普遍出现,现场他也介绍一家公司通过训练AI垂类模型,初步实现文字生成剧本+漫画+动态视频。

AI大模型趋势五、新一代AI基础设施可能成为下一个战场。新架构主要指灵活调配CPU和GPU资源,边缘计算将云服务扩展到远程,私有云解决数据和运营的合规性问题,高性能主要针对高性能计算和人工智能优化的计算和存储服务,多云集成促进管理和安全的工具,深化合作伙伴关系,主要与行业用户、基础设施提供商和ISV搭建桥梁。

钟振山指出,AI主要用于训练和推理,从训练看,还是云上和本地部署为主的投资方式,推理市场主要是云上算力为主,但是本地、边缘层面都有大量推理算力的需求。推理市场需要一种面向AI工作负载的混合架构模式。

未来随着生成式AI和大模型在企业内部落地之后,在推理方面的需求会大于训练的需求。面向AI的基础架构,包括高性能处理器、下一代存储、超融合系统、高性能AI网络,甚至精密计算、数据中心技术,未来的量子计算都可能成为AI基础架构市场的基石。IDC预测,到2027年,用于边缘推理的AI服务器价值将超过用于本地推理的服务器价值。

如何系统的去学习大模型LLM ?

作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的 AI大模型资料 包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来

😝有需要的小伙伴,可以V扫描下方二维码免费领取🆓

在这里插入图片描述

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

在这里插入图片描述

四、AI大模型商业化落地方案

img

阶段1:AI大模型时代的基础理解

  • 目标:了解AI大模型的基本概念、发展历程和核心原理。
  • 内容
    • L1.1 人工智能简述与大模型起源
    • L1.2 大模型与通用人工智能
    • L1.3 GPT模型的发展历程
    • L1.4 模型工程
      - L1.4.1 知识大模型
      - L1.4.2 生产大模型
      - L1.4.3 模型工程方法论
      - L1.4.4 模型工程实践
    • L1.5 GPT应用案例

阶段2:AI大模型API应用开发工程

  • 目标:掌握AI大模型API的使用和开发,以及相关的编程技能。
  • 内容
    • L2.1 API接口
      - L2.1.1 OpenAI API接口
      - L2.1.2 Python接口接入
      - L2.1.3 BOT工具类框架
      - L2.1.4 代码示例
    • L2.2 Prompt框架
      - L2.2.1 什么是Prompt
      - L2.2.2 Prompt框架应用现状
      - L2.2.3 基于GPTAS的Prompt框架
      - L2.2.4 Prompt框架与Thought
      - L2.2.5 Prompt框架与提示词
    • L2.3 流水线工程
      - L2.3.1 流水线工程的概念
      - L2.3.2 流水线工程的优点
      - L2.3.3 流水线工程的应用
    • L2.4 总结与展望

阶段3:AI大模型应用架构实践

  • 目标:深入理解AI大模型的应用架构,并能够进行私有化部署。
  • 内容
    • L3.1 Agent模型框架
      - L3.1.1 Agent模型框架的设计理念
      - L3.1.2 Agent模型框架的核心组件
      - L3.1.3 Agent模型框架的实现细节
    • L3.2 MetaGPT
      - L3.2.1 MetaGPT的基本概念
      - L3.2.2 MetaGPT的工作原理
      - L3.2.3 MetaGPT的应用场景
    • L3.3 ChatGLM
      - L3.3.1 ChatGLM的特点
      - L3.3.2 ChatGLM的开发环境
      - L3.3.3 ChatGLM的使用示例
    • L3.4 LLAMA
      - L3.4.1 LLAMA的特点
      - L3.4.2 LLAMA的开发环境
      - L3.4.3 LLAMA的使用示例
    • L3.5 其他大模型介绍

阶段4:AI大模型私有化部署

  • 目标:掌握多种AI大模型的私有化部署,包括多模态和特定领域模型。
  • 内容
    • L4.1 模型私有化部署概述
    • L4.2 模型私有化部署的关键技术
    • L4.3 模型私有化部署的实施步骤
    • L4.4 模型私有化部署的应用场景

学习计划:

  • 阶段1:1-2个月,建立AI大模型的基础知识体系。
  • 阶段2:2-3个月,专注于API应用开发能力的提升。
  • 阶段3:3-4个月,深入实践AI大模型的应用架构和私有化部署。
  • 阶段4:4-5个月,专注于高级模型的应用和部署。
这份完整版的大模型 LLM 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓

在这里插入图片描述

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值