这一波大模型价格战会加速行业洗牌吗?

5月22日再次更新:讯飞、腾讯也宣布免费!价格调整立即生效!

“降价,立即生效!”“免费,立即生效!”

朴实无华的商战就是这么直接,阿里百度一天之内连续对招,太精彩了!

在这里插入图片描述

Deepseek引起的火,将字节,阿里,百度等等大厂都卷起来了。

一、过程回顾

5月6日,幻方量化旗下DeepSeek(深度求索)发布第二代MoE模型DeepSeek-V2。

在这里插入图片描述

他们API的定价为:每百万tokens输入1元、输出2元(32K上下文),价格仅为GPT-4-Turbo的近百分之一。

在这里插入图片描述

好家伙,这个可谓是点燃了国内大模型价格战的导火线!

在榜单上的其他大模型分分不甘示弱。

5月11日,智谱大模型宣布更新其价格体系

在这里插入图片描述

新注册用户可获得的token额度从500万提升至2500,同时,入门级产品GLM-3 Turbo的模型调用价格从5元/百万Tokens大幅降至1元/百万Tokens,降幅达到80%。

5月13日,OpenAI推出了GPT-4o,该模型在功能上显著超越了GPT-4 Turbo,且价格仅为后者的一半。

在这里插入图片描述

5月15日,字节跳动豆包模型的价格为0.0008元/千Tokens,相当于0.8厘即可处理约1500个汉字,宣称大模型价格比同行低 99.3%。
在这里插入图片描述

5月21日,阿里在早上10点36分阿里云公众号上发布“降价,立即生效!”,将大模型价格大幅下降,并部分进行限时免费。

在这里插入图片描述

图片来源于阿里云官方号

5月21日下午14:28分,百度在官方号上发布“免费,立即生效!”,直接把这一场大模型价格战的情绪拉上了高潮

在这里插入图片描述

图片来源于百度官方号

5月22日下午5点52分,腾讯云全面下调大模型价格。

在这里插入图片描述

瓜群众表示非常过瘾。

我的各个微信群简直炸了,大家都在讨论这个话题。

互联网企业之间的商战果然不废话,上来直接就直接炸场,比的就是谁血条厚是吧?

依稀又看到了百团大战时候的壮观场景。

对用户来说自然是大利好,毕竟是实在的利益。

那么,价格战原因是什么?要知道大模型训练烧的都是钱,难道大家都不要盈利了?

二、模型优化

其实大模型价格战的根本原因,还是在于在算力未升级的情况下,得益于架构创新、推理优化、系统升级以及推理集群计算架构的改进等多方面的努力,让大模型的推理成本实现了显著的下降。

目前,算法框架的创新主要沿着两条路径发展:轻量化和线性化。

1.轻量化

轻量化以Mixtral 8*7B模型为代表,其核心是采用混合专家模型(MoE)。

在MoE架构中,多个专家网络并行工作,推理时仅激活部分专家,通过稀疏性有效压缩了参数数量和推理成本。

那么什么混合专家模型(MoE)呢,MoE架构主要由两个关键部分组成:专家网络和门控机制。

下面我用7岁孩童也能听懂的方式解释下。

假设你有一个超级大的乐高城堡需要搭建,里面有很多不同的小房间,而每个房间都有一个特别的乐高专家,他们擅长做不同的事情,比如有的专家擅长建塔,有的擅长建桥。

这些专家就像是我们的“专家网络”。

如果你想建一个新的乐高模型,你不需要所有的专家都来帮忙,只需要那些擅长做你需要的部分的专家。

而MoE大模型的“门控机制”,它可以决定哪些专家需要工作。

在这里插入图片描述

这样,我们就可以用更少的人(也就是更少的电脑工作)来完成任务,这就是“轻量化”。

2.线性化

而“线性化”呢,就像是你在玩一个记忆游戏。

正常情况下如果我们要背诵一个长篇小说,是一个很难完成的任务,你需要记住很多细节。

但如果我们把所有的细节压缩成一个简单的故事,你只需要记住这个故事的大纲,就能快速地回忆起所有的细节。

在这里插入图片描述

这样,我们就可以更快地完成任务,而且电脑也不用那么辛苦了。

大模型也是这个道理,轻量化和线性化都是让大模型工作得更聪明、更快的方法,这样我们就可以用更少的资源做更多的事情了。

长远来看,随着算力升级和架构优化等多重因素的推动,模型推理成本的下降速度可能会超出预期,从而进一步推进模型使用的平民化,推动应用层的创新和生态系统的繁荣。

三、生产力革命

历史上的科技变革往往伴随着边际成本的大幅下降。

在过去几十年,人类经历了两次大的科技变革,分别是芯片和互联网。
在这里插入图片描述

芯片的出现将计算的边际成本降至接近零,而互联网技术则将分发的边际成本降至零。

这些技术革命分别引领了计算机和互联网的革命,催生了各种巨头互联网公司。

而人工智能同样可以是一场成本驱动的生产力革命。

以我在的设计行业为例,在以往进行任何的项目设计,都需要设计师从概念设计开始,花费时间与甲方进行多轮沟通,然后设计师提供多轮稿件确定方案,才能最终根据方案进行后续制作。

而现在大模型只需极低的成本和极短的时间,就能迅速提供各种概念图片,而在后续的效果方案制作上更是能够节约大量的人力成本。

在这里插入图片描述

人工智能是实在的生产力。

而在其他行业,人工智能同样应用广泛,例如在客服行业,AI客服的成本远低于人工客服,显著提高了投资回报率。

这些在不同垂直领域的应用,都有很强的应用场景,但是目前如果小公司想要定制化的服务和长期进行服务应用,其实是受制于大模型的能力和API的价格。

如果对于大多数公司而言,采用人工智能的成本比人工成本要高,采用人工智能就完全没有必要。仅仅依靠前期补贴的情况,在商业闭环中是不可持续的。

因此,推理成本的下降将成为推动AI应用普及的关键因素。

结语

历史表明,当需求具有弹性且成本下降时,使用量会因可及性的提升而大幅增加。

如果大模型的推理成本大幅下降,未来人工智能将像互联网一样,成为全球经济的增长的新动力。

人工智能应用全面铺开后,可能会成为像网络信号一样的基础服务资源。

基于“马太效应”,到时候存活下来的玩家,必然将两极分化。

而这,势必会像几年前“百团大战”一样,对行业进行剧烈的洗牌。

没有资金储备的大模型公司,恐怕很难挺过这一次消耗战。


最后的想法

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

-END-

👉AGI大模型学习路线汇总👈
大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)
在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉AGI大模型实战案例👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉AGI大模型视频和PDF合集👈
观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述

在这里插入图片描述

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
在这里插入图片描述

  • 30
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值