大模型的现在进行时:走出对话框,走向产业端

随着大模型热潮消退,市场开始冷静评估其价值。大模型面临高昂成本和缺乏杀手级应用的挑战,科技大厂和创业公司需将模型融入行业,实现效率、体验和创造的价值。2024年,市场关注点将转向模型的实际应用和生态融合,而非单纯的竞争。
摘要由CSDN通过智能技术生成

2024年也许就是大模型市场的拐点,不再是“炼模型”的时代,而是“用模型”的时代。

大模型热潮涌动了一年多后,越来越多人平复了激动的情绪,开始从客观的视角重新思考大模型的价值和机会。

红杉资本在Al Ascent 2024的开场演讲中提到,大模型的创造能力和推理能力,第一次实现了以类似人类的方式进行交互,将支撑起数十万亿美元的市场。

然而和AGI的遥远梦想相比,大模型的创业者们却不得不正视摆在眼前的现实挑战:大模型的训练成本高达数千万元,但至今还鲜见杀手级应用,在“先射箭后画靶”的质疑声中,生存仍然是最先要考虑的问题。

一面是重构千行万业的机会,一面是必须要翻越的高山,2024年的大模型市场,还会翻出怎样的浪花?

01

大模型的数量快速收敛

据不完全统计,国内已经有200多个大模型,并且引发了“百模大战”的说法。可稍微理性一些就能明白,“大炼模型”不过是早期过于狂热的产物,不少大模型存在“套壳”的嫌疑,有机会上牌桌中终归只有头部几家。

市场研究机构CB Insights发布的《2023年人工智能行业现状报告》显示,2023年中国AI领域的投融资数量约为232笔,同比下降38%;融资总额约为20亿美元,同比下降70%。大模型热度空前的局面下,资本市场却罕见“降温”。

对2023年的融资数据再深挖一层,融资额度在5000万元以上的项目只有26个,其中还包括少数几家企业的多轮融资。而大模型本就是一门“烧钱”的生意,那些拿不到钱的创业者,注定会悄无声息地消失。

事实也是如此。大模型热潮进入到第二年,真正有机会进入决赛圈的企业,似乎只剩下两个流派。

一派是有资源、有技术、有人才的科技大厂,比如百度的文心大模型、阿里的通义系列大模型、华为云的盘古大模型等。在ChatGPT走红之前,这些科技大厂就已经开始探索大模型的方向,对大模型价值的理解也更加深刻。

比如华为云在2023年7月发布的盘古大模型3.0,被定位为“一个面向行业的大模型系列”,注意力聚焦在了产业层面。百度创始人李彦宏也曾多次公开表示,“卷大模型没意义,卷AI原生应用才有价值。”

另一派是被互联网大厂青睐的明星创业者,目前主要是智谱AI、月之暗面、百川智能、零一万物和Minimax,被媒体形容为“大模型五虎”。

五家“独角兽”拿走了大模型领域40%以上的融资,但总融资额不到200亿元,而亚马逊已经为Anthropic投资了40亿美元,微软对OpenAI的注资早已超过100亿美元。“缺钱”仍将是国内大模型创业者的常态。

需要说明的是,现阶段的大模型市场远没有到决赛时刻,淘汰赛才刚刚开始,新的大模型仍有机会崛起,一些熟面孔也可能跑不到最后。但可以笃定的是,大模型不是一场毫无章法的无序竞争,并不难猜测接下来的走向。

当前大模型被普遍认可的有三个价值,即效率、体验和创造,且都不缺少落地的土壤:在体验层面优化人机交互,创造层面已经产生了大量的AIGC内容,效率层面的直接例子就是编程和研发效率的提升。

而价值体现的唯一路径,正是将模型和各行各业的需求融合。也就意味着,“炼大模型”将是小部分玩家的战场,将大模型的能力落地到千行万业,才是每一个开发者都可以参与其中的事,才会是大模型的终极方向。

02

走出对话框,走向产业端

互联网技术的普及,在很多人眼中是先To C再To B的路线,不管是电商、搜索还是网络游戏,目标对象都是个体为单位的消费群体,直到国内的人口红利见顶,“产业互联网”的概念才渐渐被讨论。

以至于在大模型浪潮兴起后,不少人想要重走互联网的“老路”。可把视角放大一些的话,互联网的繁荣其实是网络传输技术落地应用的“果”,借用业内普遍将算力比作电力的比喻,算力和数据是“燃料”,而大模型对标的是蒸汽时代的发动机、电力时代的电动机,扮演的是“引擎”的角色。

以电动机为例,在日常生活中无处不在,却几乎没有人会注意到,因为创造价值的是电动机驱动的空调、洗衣机、榨汁机等产品。沿用同样的逻辑,对话式AI就像是给电动机加了扇叶,目的是给人们演示电动机的作用,想要进一步释放大模型的价值,必须要走出对话框,走向产业端。

科技大厂选择“面向行业”的原因也就不难理解。尽管大模型产业应用的时间并不长,价值却早已被验证。

早期是科研等领域的试水。

2018年的时候,谷歌大脑团队就宣布完成了可识别蛋白质结晶的计算机视觉技术,用于辅助多种疾病的药物研发。

预训练大模型诞生后,不少科研机构开始将大模型能力应用到药物研发领域。比如西安交通大学第一附属医院的刘冰教授团队,基于盘古药物分子大模型发现了全球40年来首个新靶点、新类别的抗生素,将先导药物的研发周期缩短至1个月,研发成本较传统方式降低了70%。对比新药研发“平均需要10年时间、花费10亿美元”的铁律,大模型的能力几乎可以用“降维打击”来形容。

然后是大中型企业的探索。

不同于外界印象中的“守旧”形象,拥有丰富私有数据资源的大中型企业,在大模型落地应用中,可以说是名符其实的先驱。

可以找到的案例也更多。蚂蚁金服发布了金融大模型,涵盖理财顾问、保险代理、投研、金融营销、保险理赔等业务;山东能源集团在华为云上搭建了“盘古矿山大模型”,涵盖9大专业40多个应用场景,推进人工智能大规模“下井”;广发证券通过盘古大模型大幅提升了预测精度,企业财务异常识别准确率高达90%……有别于自上而下的赋能,大中型企业已经学会了使用工具。

现在越来越多行业开始拥抱大模型。

比起缺乏付费意愿的C端用户,一旦大模型释放的生产力被印证,B端客户对新技术的渴求要更加强烈。

IDC曾在2023年第四季度进行过一场AI应用调研,结果显示超过九成企业已经布局了AI应用,已经接触大模型并且有明确预算的企业占比24%、34%的企业开始制定潜在应用场景、35%的企业开始进行试点,仅有7%的企业对生成式AI完全没有规划。历史上的每一次工业革命,都离不开新旧生产力迭代,只要大模型能够做出场景创新,大大小小的企业总能在权衡后做出正确的选择。

不过,大模型的落地是个相当复杂的系统工程,除了在方向上达成共识,还要找到更高效、更普适的路径。

03

终端和大模型加速融合

智能手机、PC、智能汽车、智能音箱等数量庞大的终端,俨然是大模型落地中不可或缺的一环。如果把大模型比作“超级大脑”,智能手机、智能汽车等终端就是人类走向AI时代的“器官”。

所以在过去一年中,端侧AI的说法被频频提及。

华为在2023年8月的鸿蒙4.0发布会上,官宣了小艺智能助手的升级,不仅支持用户使用自然语言进行交互,还能帮助用户输出小作文、图片、视频等内容;三星将生成式AI作为Galaxy S24系列的最大卖点,实现了即圈即搜、通话实时翻译、笔记助手;即使是慢了半拍的苹果,也在不久前公布了自己研发的MM1多态大语言模型……大模型和终端的融合已经是一种现在进行时。

端侧AI的理念,让外界看到了人机交互再次被重构的可能。就像触摸屏淘汰了传统的键盘和鼠标,打开了超级APP的格局,大模型让“人机对话”成为现实,和智能助手聊聊天就能点外卖、打车、购物。

倘若只是从“入口之争”的角度看待大模型和终端的关系,不仅和大模型走出对话框的趋势相悖,也低估了终端厂商的决心。

不久前结束的第21届华为分析师大会上,华为副董事长、轮值董事长徐直军在主题演讲中提到了两个不应被忽略的信息:

第一个是打造统一的开发者平台,面向鲲鹏、昇腾和鸿蒙生态所有的开发者,将基于华为云打造一个统一的开发者平台,给开发者一个统一的入口,让开发者在这三个生态上自由地移动。

第二个是打造“小艺”超级智能体,基于盘古大模型把“小艺”打造成为超级助手,并把HarmonyOS Next打造成为一个原生智能的操作系统,统一AI能力底座,构建系统级原生智能。

统一的开发者平台和系统级原生智能,既是进一步打通产业端和消费端的关键,也是对大模型和终端深度融合的注解。

比如开发者可以通过盘古大模型理解和匹配用户的高阶意图,结合意图框架做服务管理和分发,精准地触达目标用户,在电商、政务、金融、教育等场景中提供用户需要的个性化服务;再比如加速大模型工程化,在数据工程、模型开发和应用开发等环节外,不断简化应用部署和分发的流程,原本需要面向不同终端开发不同APP的服务,也许只需要唤醒“小艺”就能满足。

刚刚,华为开发者大会2024(HDC2024)官宣,将于今年6月21日~23日在东莞举办。根据HDC2024邀请函中释放的信息,会上将发布盘古大模型5.0,并将和HarmonyOS Next鸿蒙星河版同台亮相。同时也预示着,徐直军在主题演讲中的内容并非是在“讲故事”,而是2024年即将上演的一幕。

做一个大胆的预测,在HDC2024披露更多关于盘古大模型5.0以及端模融合的消息后,将有越来越多的终端厂商跟进,讨论的焦点将不再局限于端侧大模型,而是怎么打通生态、怎么为开发者赋能,跳出“入口之争”的思维误区,推动大模型从尝鲜期走向落地期,从“好玩”走向“好用”。

有别于行业端落地的润物无声,数以亿计、乃至十亿计的智能终端,直接影响着普罗大众的体验和感知。终端和大模型的结合,不单单是终端厂商的“战争”,关系着每一个开发者的前途命运。大模型的行业应用和用户教育,不再是两条平行线,2024年将是交叉的开始。

04

结语

回顾每一次工业革命的历程,比发明更重要的其实是推广,怎么将新技术推向千行万业。

大模型代表的新一轮工业革命也是如此。大模型的价值,不在于有多少参数,甚至不在于有多么“逆天”的能力,而是让大模型被越来越多的人使用,通过场景化的创新产生价值。2024年也许就是大模型市场的拐点,不再是“炼模型”的时代,而是“用模型”的时代。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

123?spm=1001.2014.3001.5501)这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值