AI大模型的10大趋势预判!

大模型发展竞争愈发激烈。全球瞩目的文生视频Sora、谷歌Gemini 1.5、Meta的V-JEPA以及超越GPT4的Claude3相继发布。Open AI的GPT5也即将问世。奥特曼不仅自研芯片,还投资可控核聚变公司,以算力和能源为未来储备关键资源。

在算力紧平衡和数据资源荒的背景下,面对快速变革,笔者尝试对未来大模型的发展做出10个预判:

判断一:中国基础大模型的数量会快速收敛,卷不动了

中国大模型行业呈现“百模大战”态势,但2024年随着基础大模型如Claude3和视频大模型如Sora的能力提升,资源不足和“套壳”大模型厂商可能退出,行业将转向几家大厂和少量明星创业企业的竞争。国外则以大厂与创业公司合作为主,如微软与Open AI、谷歌与Deepmind等。芯片巨头英伟达也在2023年大举投资生成式AI项目,比2022年多6倍。但国外基础大模型领域并未出现类似的激烈竞争。

在这里插入图片描述

判断二:万卡是一个入门的算力

近日,Perplexity的CEO Srinivas在《Invest Like The Best》节目中透露,他曾试图从Meta聘请资深研究员,但被对方以需要1万块H100 GPU回应,反映了基础大模型训练对算力的巨大需求。GPT4和GPT5的训练分别需要2.5万张A100和5万张H100(相当于15万张A100)的算力。扎克伯格计划购买35万张H100芯片以追赶GPT5。而0pen AI创始人奥特曼计划筹集7万亿美元自研AI芯片。

在中国,2023年前三季度,英伟达中国营收推算显示,中国新购买的算力相当于58万张A100,但仍远不及Meta。受美国芯片禁令影响,中国无法补充先进算力,导致处于严重被动。国内芯片厂商如华为、海光等,受制于产能问题,供货量距离大模型训练需求尚有较大缺口。此外,国产AI芯片存在适配周期长、成本高、难度大等问题,延长了国产大模型训练周期。

判断三:大模型的能力取决于一个团队金字塔顶尖人才的认知,小团队也能涌现高智能

大模型的发展由顶尖人才推动,人才密度和强度是关键。OpenAI的三位灵魂人物——Sam Altman、Greg Brockman和首席科学家伊利亚,在7年间持续投入数十亿美元,坚持AGI信仰,成就了ChatGPT的传奇。同样备受瞩目的Claude模型公司,由OpenAI核心员工如Dario Amodei和Tom Brown创立,其成员对大模型的深刻理解是取得突破的原因。尽管只有22人,但Character.ai因其Google前员工Noam Shazeer的技术背景,成为访问量第二的聊天应用。而20多人的Mistral公司,由前DeepMind和Meta科学家创办,三位创始人均有大模型开发经验,并在基准测试中表现出色。

在这里插入图片描述

判断四:开源大模型难以胜过闭源

开源是软件领域的重要趋势,推动了应用生态的繁荣。然而,从GPT3开始,Open AI选择了闭源,导致开源大模型停滞在GPT3.5水平。目前,业界口碑较好的开源大模型包括Meta的LLaMA2、Mistral的Mistral 8x7B、智谱的ChatGLM-6B等。大模型的代际碾压效应导致基于GPT的小公司面临倒闭风险。

开源方式更适合做生态,但受限于算力和算法等,原有集众智的开源模式很难在基础大模型自身的快速演进上复现。

在这里插入图片描述

判断五:能走多远,取决于对AGI和Scaling Law的信仰

Open AI等大模型企业对AGI的信仰获得更多认同,Sora从视频理解到世界模拟器的路径、杨乐昆的世界模型构想,都是产业界迈向AGI的努力。大力出奇迹的范式被证明有效,包括Sora的成功,也再次验证了视频领域Scaling Law的有效性。Open AI以Scaling Law为核心理念,坚信规模化在模型、系统、自身、过程和雄心壮志中的魔力,鼓励在疑惑时扩大规模。

判断六:个人应用要过千万月活门槛

移动互联网时代的APP用户数量庞大,但中国AI原生APP增长相对较慢,目前头部的APP月活用户刚刚突破千万。即使在互联网圈,也有很多人没有使用过这些APP,特别是在三四线或更小的城市。根据QuestMobile报告,头部APP应用去重月活用户突破5000万,这些应用主要集中在文本和图像生成领域。其中,豆包、文心一言等应用以月千万活跃用户规模领先,其次是天工、扮伴-AI绘画及讯飞星火等应用。

在这里插入图片描述

相比而言,2022 年 9 月至 2023 年 8 月期间,全球排名前 50 的人工智能工具吸引了超过 240 亿次访问。ChatGPT 以 140 亿次访问量领先,占分析流量的 60% 以上。

在这里插入图片描述

判断七:手机端侧大模型将加剧和超级APP的入口之争

大模型正逐渐转向端侧,使得AI推理能够在手机、PC、耳机、音箱、XR、汽车等新型终端上运行。端侧大模型具有优势,如本地数据处理效率高、节省云端成本、增强用户数据隐私保护,以及开启新的交互方式。未来,结合向量化后的个人数据,端侧大模型将提升手机交互流畅性,实现更多原生操作和功能。多家企业已推出端侧大模型,如小米的MiLM、VIVO的蓝心等。此外,高通和苹果等芯片厂商也在积极支持端侧推理。然而,端侧大模型可能成为新的手机交互入口,可能导致APP被边缘化,加剧手机企业在生态内的话语权。
在这里插入图片描述

判断八:效率、体验、创造是当前大模型落地三大核心价值

效率是大模型推动自动化的核心逻辑。体验和创造则是其落地的特别驱动力。交互更加友好,机器逐渐适应人,理解指令、语言甚至情感。

创造是生成式大模型的核心能力,已被广泛应用于文字、图片创作、传媒影视、广告、短视频和游戏等领域。模型幻觉问题也可能通过创造的方式激发更多灵感。在AI4S领域,创造提供了更大的想象空间,AI科学家有望在未来取得更多突破。例如,DeepMind开发的深度学习工具在17天内合成了41个拟定化合物,成功率达71%,每天平均产出2个以上新化合物。

判断九:未来可能出现更多的一人企业

大模型与AI Agent的进步,为个人提供了更多智能工具支持。未来,个人可能拥有多个助理,从而加大了对个人领导力和判断力的要求。一人企业的趋势也在改变大企业的组织方式,组织内个人的角色变得更为多元,如身兼数职。同时,数字员工成为企业核心竞争力之一,其数量和质量至关重要。

在这里插入图片描述

判断十:“技术派”VS“变现派”的争论在3年内会有定论

最近,“小珺访谈录”的两篇文章对杨植麟和朱啸虎的观点进行了比较,表明中国科技界对大模型的态度存在分歧。一方是技术信仰派,主张像OpenAI一样追求AGI和scaling law,认为模型能力提升和成本降低将解锁更多应用。另一方是市场信仰派,认为应将足够的AI能力投入能快速变现的商业场景中,利用中国市场的独特数据建立优势。这种分歧反映了长期主义和实用主义的争论。

OpenAI的成功为长期主义提供了激励,预计到2026年将迎来GPT6等更强模型,具有商业价值。然而,降低幻觉率仍是技术挑战,未来大模型可能提供置信度概率,以区分参考和确定性判断。

综上,基于scaling law,未来模型的规模无可想象,大模型之路的尽头是算力,更是电力

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

  • 40
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值