2024,大模型杀进“决赛圈”

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

Henry Chesbrough在著作《通过技术创新盈利势在必行》中,曾提出过一个创新的“漏斗模型”。开放式创新一开始鼓励百花齐放,但最终只有10%的技术能够通过这个漏斗,成功抵达目标市场target market,进入到商业化与产业化的下一个阶段,而其余的90%的技术,逐渐淡出人们的视野。

大模型的2024,就经历了漏斗秩序的残酷检验。

2023年初,业界最关注的问题是“中国能不能孕育出顶尖的大模型”。随后一年,国产大模型数量的井喷式增长,完成备案并上线服务的大模型数量已达100多个。

于是到了2024年初,大家最关注的问题已经变为“这么多的大模型,我们该怎么消化和利用?”

如今来看,经过百模大战,基础大模型已“去九存一”,只有约10%的具有市场活力、用户活跃度高的大模型脱颖而出,进入到了决赛圈。大模型的商业市场,也从百家争鸣,收束为两股势力:

一是以互联网、云计算企业为代表的科技巨头,包括百度的文心大模型、阿里的通义大模型、腾讯的混元大模型、字节跳动的豆包大模型、华为的盘古大模型。

二是以“AI六小虎”为代表的头部创企,比如智谱AI的智谱清言、零一万物的Yi大模型家族。

可以说,大模型在2024年,走过了一个完整的“漏斗模型”。但重资产的大模型行业,竞争也远比一般技术更残酷。我们预计,99%的大模型都会丧失产业空间。所以,这场模型淘汰赛并未到终局。接下来,基础模型的创新漏斗还会进一步收窄,最终仅留下三四个产品,作为AI基础设施。

我们还是有必要花一点篇幅,来回溯一下2024年的大模型淘汰赛,留下了哪些种子选手。

2024国内外的大模型格局,都呈现出鲜明的马太效应。在海外,OpenAI、谷歌、微软等巨头屹立不倒,而众多大模型初创公司,诸如Stability AI、Adept、Humane、Reka AI等,则排队寻求出售。

国内的情况也大致相似。以互联网和云厂商为代表的科技巨头(百度、阿里、腾讯、华为、京东、字节跳动),以及融资能力出众的AI创企(AI六小虎),成为大模型商业市场中具备活力的竞争者。

潮水退去,暴露出沙滩上的礁石,而产学各界炼大模型的热情消退,我们得以在2024年看到更清晰的大模型商业模式。具体来说,大模型成功穿过漏斗,需要三种动力:

**1.可持续的资源投入。**AI大模型是一个重资产行业,2024年Scaling Law仍未失效,随着模型不断变大,训练新模型所需要的高质量数据量与计算量也在增加。这就像登山,百尺竿头更进一步。而头部企业在资金、技术、数据等方面的优势日益凸显,代表就是字节跳动。

字节跳动2024年才开始全力押注大模型,5月推出的豆包大模型很快就在业内崭露头角,日均Tokens使用量从5月份的1200亿,9月突破了1.3万亿。凭借此前的火山云基础设施和人才团队积累,以及这一年大举挖人、增加投入,在几个月内就建立了优势壁垒。

**2.快速迭代的模型能力。**字节跳动的后来居上、快速超车,也说明AI大模型并没有特别安全的护城河。模型能力在不断贬值,有了新的更高级的模型版本,旧模型就不值钱了;有了开源模型,能力接近的闭源模型就会被开发者放弃。这就要求模厂不断开发更强大的新模型,迭代旧模型。

比如文心大模型,得益于百度在芯片、框架、模型和应用上的全栈布局,以及飞桨深度学习平台和文心的联合优化,文心大模型的迭代速度,一直处于业内领先水平。2024年百度在文心大模型4.0的基础上,相继推出了文心大模型4.0工具版、文心大模型4.0 Turbo,推理速度和效果进一步提升。而模型的迭代速度快,有助于增强用户和开发者的信心,增加使用黏性和付费意愿。

**3.可变现的商业通道。**模厂的竞争,不仅表现在基础模型的研发上,而体现在后续的商业推广。

2024年,大模型从“价格战”杀到了“免费战”,5月字节跳动将国内大模型的市场价格带入“厘时代”,随后文心大模型就宣布两大主力模型ENIRESpeed和ENIRELite全面免费。随着模型进入免费时代,模厂就必须有其他商业通道来实现营收,收回自己在大模型上的前期投入。

**其中,科技巨头大多直接掌握着用户数据、应用产品和渠道资源,可以让AI大模型触达最终用户,为价值付费。**比如百度文库app,就通过AI改造,上线了基于文心大模型的智能PPT、智能画本等一系列AI功能,付费用户快速增长,目前已有数千万AI月活用户。

而AI创企则有望凭借新锐的技术和产品解决方案,在商业市场中脱颖而出。“六小虎”中,零一万物明确表示不会放弃预训练模型。目前,零一万物正基于Yi 系列基座模型的标准化能力,深入业务场景的垂直精细化切口,推出了数字人解决方案“如意”、营销短视频解决方案“万视”。

总的来说,2024的大模型产业,就是一个又一个的大模型被推向市场之后,不得不面对一个狭窄的“漏斗”出口,经历一场艰难的淘汰赛。互联网与云计算巨头和极少数AI独角兽,成功穿过漏斗,抵达下一阶段。

2024年的淘汰赛洗礼,让大模型去九存一,产业格局更加合理,只留下了约10%的大模型进入决赛圈。

从结果看,大模型呈现出“强者恒强”的马太效应。那么,这些强者是怎么从战场中厮杀出来的呢?如果说2023年,大模型的关键一战,是基础设施攻坚战,各个模厂都不遗余力地建设训练大模型所需要的算力集群和高端硬件资源,那么2024年,大模型的关键一战,则转向了商业市场的争夺战。

争夺活跃用户,这一年大模型的商业市场有两个主题:

主题一,烧钱营销。

基于大模型的生成式AI(AIGC)产品,可以通过为用户提供服务来完成商业转化,这也成为大模型最直接、最快速的商业化路径。2024年,AIGC产品爆发,根据《生成式人工智能服务已备案信息》显示,截至2024年11月,我国共有309个生成式人工智能产品完成备案。而如此繁多的AIGC产品,存在大量重叠的功能,于是,模厂不得不通过大规模、高频次的市场推广和营销活动,来争夺活跃用户,提高用户基数。

月之暗面、智谱等都被报道过在营销上砸了重金,kimi智能助手的平均单个用户获客成本高达30元。

这些烧钱营销的AIGC产品,切实提升品牌知名度和用户基数,但也必须承认,最终能够激活多大的商业价值尚不明确。

主题二,走向应用。

不烧钱买流量,不赔本赚吆喝,大模型有可能赚到钱吗?那就需要向应用走。走向产业,走向广大用户和开发者,通过价值付费、项目付费等实现商业化,2024年,“大模型致用”已经是事实。

首先是智能体,让大模型更有用。大模型的应用从AI助手,转向了智能体,比如豆包、kimi、文小言等,能够自动拆解指令并执行一些简单的操作,“自动驾驶”水平更好,极大地提升了技术的可用性。

其次是****工具链,让大模型更好用。文心智能体平台、字节跳动扣子、阿里通义千问等,都推出了智能体技术及工具链的支撑能力,普通人也能快速低成本地制作属于自己的智能体。其中,押注“AI应用化”的百度在智能体生态上布局最全,推出了APP builder、Agent builder等开发平台,以及本地部署一体机等硬件,支持C端和行业用户开发专属智能体。字节跳动的扣子也极易上手,用户可以复制官方的高质量模板,结合私有数据快速完成智能体开发,并发布到字节系等产品中使用。

“砸钱买量”“以用换量”,这两大主题交织在2024年的大模型商业化之战中,一家模厂可能综合运用这两种手段,来确保大模型的用户基数与市场活力,稳固住这一阶段的领航地位。

消费级技术,有一个基本规则:将复杂技术简单化,从而解锁突破性应用。就像我们平时发邮件,不需要探究背后的SMTP协议,使用手机支付,也不必弄懂背后的加密技术。这种“藏起代码”的简化,使得技术更加易用,因此能够更快普及和扩展。

由此,我们可以预测一下,底层模型的“决赛圈”可能发生哪些变化:

**模型数量变少。**科技巨头和AI创企领航的大模型们,还将继续洗牌,最终只留下3—4个基础模型,作为基础设施来支撑丰富多样的下游应用。这个过程中,投入的可持续性、迭代速度、商业化能力依然会发挥关键影响,互联网公司和云厂商的胜算更大。

**使用进一步简化。**目前来看,大模型技术的使用还有继续简化的空间。比如智能体开发,仍然没有实现低代码或零代码,一旦涉及个性化场景的专业插件、知识库、数据处理等,开发工程的复杂度就又会变高,阻拦一些行业专家开发专业性更强的智能体,这限制了大模型在B端的爆发。所以2025年,智能体开发与专属模型训练,应该会变得更简单、傻瓜式,想上手AI开发的零基础读者不妨期待一下。

**生态变大。**人人都能上手AI开发,涉及对私有敏感数据的训练分析,以及多种多样的个性化功能需求,因此基础模厂不能只提供对一个底层模型的简单封装,而要支持本地训练与部署,多种模型的调用与组合,更多元的发布渠道,这些要求基础模厂能够将AI硬件、AI终端、垂类模厂、渠道伙伴等都纳入自身的生态体系内,共同满足用户的定制化需求。“朋友圈”有多大,也是2025年的一个大模型赛点。

2024年,底层模型的中场战事宣告结束,进入决赛圈。随着大模型的漏斗被收束到最小,AI应用的漏斗才刚刚开始喷发。你听,“人人皆可AI”的2025离我们越来越近了。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

一、大模型全套的学习路线

学习大型人工智能模型,如GPT-3、BERT或任何其他先进的神经网络模型,需要系统的方法和持续的努力。既然要系统的学习大模型,那么学习路线是必不可少的,下面的这份路线能帮助你快速梳理知识,形成自己的体系。

L1级别:AI大模型时代的华丽登场

L2级别:AI大模型API应用开发工程

L3级别:大模型应用架构进阶实践

L4级别:大模型微调与私有化部署

一般掌握到第四个级别,市场上大多数岗位都是可以胜任,但要还不是天花板,天花板级别要求更加严格,对于算法和实战是非常苛刻的。建议普通人掌握到L4级别即可。

今天只要你给我的文章点赞,我私藏的大模型学习资料一样免费共享给你们,来看看有哪些东西。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

img

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

img

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值