大模型企业分化 算力成买方市场

从2024年开始,采购和租用算力设备的企业减少了;2024年下半年以来,算力中心的机架出现了一定程度的空置;曾被炒到15万元一块的英伟达高性能加速卡A100的价格不再上涨,另一款性能配置相对较低的4090显卡被算力企业频繁采购用作算力加速芯片。


2024年至今,人工智能产业发生了阶段性转变。

根据经济观察报统计,截至2024年10月9日,网信办共通过188项生成式人工智能备案,也就是有188个大模型可以上线提供生成式人工智能服务。超过三成的大模型在通过备案后未进一步公开其进展情况;仅有约一成的大模型仍在加速训练模型;接近一半的大模型则转向了AI应用的开发。

这与过去一年多来的“百模大战”形成鲜明对比。

这一变化也传导至上游的算力市场。2024年9月27日—29日中国算力大会召开期间,经济观察报从算力运营方、建设方和芯片供应商处获悉,国内算力的供需关系已不再紧张。

2022年以来,互联网公司、人工智能企业争相采购算力设备,以运营商为代表的央国企投入巨资建设算力中心。供应链上的AI服务器经常缺货,算力GPU一卡难求,数月内价格翻倍。

从2024年开始,采购和租用算力设备的企业减少了;2024年下半年以来,算力中心的机架出现了一定程度的空置;曾被炒到15万元一块的英伟达高性能加速卡A100的价格不再上涨,另一款性能配置相对较低的4090显卡被算力企业频繁采购用作算力加速芯片。

一位中国电信人士称,算力已经转入买方市场。

大模型企业分化

算力的使用者——大模型企业正出现分化。

截至2024年8月底,网信办共通过188项生成式人工智能备案。然而,根据经济观察报统计,有60个(32%)大模型在备案通过后,没有再公布过提升大模型参数量级或应用落地的进展,有9个(5%)大模型更新了版本,但未说明参数量级及预训练数据量变化。

这些模型绝大多数来自中小型企业或机构,例如深言科技、聆心智能等企业的多个开源社区项目近一年没有更新。

这188个大模型中,仍有22个模型在加速训练,在今年更新了版本并增加参数量及预训练数据量。

这些模型主要来自大型互联网公司、运营商、AI大模型企业,其中只有4家企业发布万亿级参数的大模型,且大规模增加了预训练的数据量,包括腾讯、中国电信以及两家大模型创业公司MiniMax和阶跃星辰。

这些企业对用于训练大模型的算力明显增加了需求。2024年以来,腾讯、中国电信已经建成万卡集群算力池,MiniMax则是在3月首批入驻中国电信上海临港国产万卡算力池。

另外18个模型的参数量在百亿至千亿级别,参数量和预训练数据量的增加较为有限,这些模型来自百度、阿里巴巴、科大讯飞、商汤科技、华为等企业。

这些厂商也在加速更新基础模型。阿里巴巴发布了通义千问2.5版本,参数量达到千亿级别,这是继去年10月2.0版本后的一次重大更新。2024年上半年,商汤科技将“日日新”大模型推进至6000亿参数规模。相比之下,去年更新较快的百度步伐有所放缓,其文心4.0大模型自去年10月以来未有新版本发布。

一位百度技术人士告诉经济观察报,百度的基础模型一直在进行最前沿的AI训练,只是目前还没公布成果,“大厂肯定不会放弃训练模型的,否则就彻底分不到蛋糕了”。

表1:188个已备案大模型在2024年(截至10月9日)的变化情况

数据来源:经济观察报整理

根据经济观察报统计,在通过备案的大模型中,有接近50%在今年转向AI应用。

大多数模型已落地到已有应用中或推出了新应用。例如,360浏览器接入360智脑大模型后,增加了AI搜索功能,能够根据提问生成深度回答并进行多轮追问;金山办公在WPS办公套件中增加了AI生成PPT和文案的功能。

这些模型通常用于实际任务,即从训练阶段进入推理阶段,所需算力会明显减少。

一家大模型厂商的基础模型在达到百亿参数量后转向了行业应用,为避免后期使用成本过高就没有扩充参数量,因此也不需要过大的算力。

该模型厂商人士认为,大模型并非越大越好,更大参数量意味着使用成本更高,千亿、万亿参数规模的模型主要是为了刷榜。

IDC中国副总裁兼首席分析师武连峰对经济观察报称,“百模大战”开启一年多以来,市场出现了分化现象:少数模型继续沿着通用大模型的路径,迈向千亿或万亿参数量级;另一些从基础模型研发转向了应用层面的开发,市场上也涌现出一批基于大模型技术的工具类应用。这些应用同质化明显,没有出现广泛使用的爆款案例。

根据第三方数据服务商AI产品榜发布的9月数据,全球排名前十的AI应用中有7个来自美国,2个来自中国——百度搜索AI智能回答和360AI搜索。美国AI应用ChatGPT的月访问量为32.3亿,百度搜索AI智能回答的月访问量约为ChatGPT的八分之一,360AI搜索的访问量不到ChatGPT的十分之一。

算力变成买方市场

大模型市场与算力市场关联密切。按照规模定律(Scaling law)的原理,如果要训练更大的大模型,首先要增加参数量或预训练数据量,如果模型的参数量增加10倍,所需算力可能增加100倍甚至更多。

当前,一些大模型停留在了训练阶段,另一些转向了应用和实际交付阶段,但尚未被广泛使用。从需求方看,相关企业对训练算力的需求明显减少,对推理算力的需求也没有出现爆发式增长,而从供给方看,中国已建和正在建设的智算中心超250个,算力持续供给仍未停止。

建造一座算力设施通常需要投资方、运营方、建设方的合作。投资方主要是地方政府和央国企;运营方包括电信运营商以及互联网公司、华为等企业,还有少数房地产等传统企业跨界参与;建设方通常包含服务器提供商和GPU芯片提供商。

超聚变是一家提供服务器和算力服务的供应商,客户主要是金融、互联网、电力企业。这家公司在最近几个月感受到了行情转变,去年的互联网厂商都来抢服务器,买家需求非常急迫,确认有货就能下单,谈价过程很快,有时甚至不用谈价。2024年以来,前来采购的客户变少,询价和谈判时间更长,买方更注重产品的性价比和技术规格。

此外,智算中心也出现了一定程度的空置。中国电信在全国各地投产了10个智算中心。前述中国电信人士发现,很多算力中心都没有被充分利用,很多机架是空置的。

根据中国信息通信研究院数据,中国算力设施中的机架数量在2024年上半年仅增长2.5%,而2023年全年增长了25%。算力设施中的机架数量间接反映了实际的算力规模。

今年的《政府工作报告》提出,适度超前建设数字基础设施,加快形成全国一体化算力体系,培育算力产业生态。诸多地区当下的算力建设规模是根据未来2—3年的算力需求来规划的,在模型计算尚未爆发的阶段,必然出现利用率不足的情况。

前述中国电信人士对经济观察报称,现在的算力已经是买方市场,用户有更多算力价格的议价权。投资方的态度也更为谨慎和理性,开始对运营方提出相应的回报要求与考核。运营方一方面转向采购性价比更高的算力设备,另一方面,正采用更灵活的策略,比如按需建设算力,在产能规划上布置了上千台机架,接到明确的用户需求和订单才会真正采购算力设备并上架运行。“作为运营方,我们已经不能像原来一样不计成本地投入,要想尽快回收成本,必须考虑成本投入和投资回报周期。”该中国电信人士称。

产业对算力芯片的采购也更注重性价比。2024年以来,国内对英伟达4090显卡的需求正在上升,目前,这款顶级游戏显卡的价格从年初的12000元涨至18000元。

一位英伟达代理商告诉经济观察报,下半年以来,4090显卡的周转率非常高,到货3天就卖出去了。相比之下,A100的单价不再上涨,维持在15万元不变,周转率却在下降。

4090和A100都属于GPU芯片,在英伟达产品线中,4090是一款面向玩家的高端游戏显卡,A100则是卖给算力中心的高性能加速卡。4090在部分性能上弱于A100,但也能满足一部分模型的推理任务,最重要的是,其价格是A系列和H系列加速卡的十分之一。

这一波4090显卡的买家绝大多数是企业,大多是智算中心的建设方或者技术提供方,用平价显卡替代高价的A100或H100芯片。

商汤科技正推动大模型进入端侧、交付客户。但在模型进入商业闭环阶段,这家企业对算力的需求也在变化,包括采用智能算力调度等技术来提升算力效能。商汤科技智能产业研究院院长田丰称,过去公司不计成本地采购算力,如今更追求算力的性价比。

在这里插入图片描述

大模型&AI产品经理如何学习

求大家的点赞和收藏,我花2万买的大模型学习资料免费共享给你们,来看看有哪些东西。

1.学习路线图

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2.视频教程

网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。

在这里插入图片描述

在这里插入图片描述

(都打包成一块的了,不能一一展开,总共300多集)

因篇幅有限,仅展示部分资料,需要点击下方图片前往获取

3.技术文档和电子书

这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。
在这里插入图片描述

4.LLM面试题和面经合集

这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。
在这里插入图片描述

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值