低价“杀死”大模型

这几天,大模型的价格战打得火热。模型价格一降再降,百度、科大讯飞、腾讯甚至直接宣布免费。

5月6日,DeepSeek发布二代MoE大模型DeepSeek-V2,能力对标 GPT-4、llama 3-70B,定价为每百万 tokens 的输入和输出分别是1 元和2元,是GPT-4 Turbo价格的近百分之一。

DeepSeek成为降价潮的开端。

紧接着,智谱AI第一个跟进。5天后,智谱AI宣布入门级产品GLM-3 Turbo模型调用价格从5元/百万tokens 降至1元/百万tokens,降幅高达80%。

5月15日,在火山引擎原动力大会上,字节跳动放出豆包0.0008元/千Tokens的超低定价,直接将模型价格带入到“厘元”时代,可以说将大模型“低价”拉向了高潮,价格战的火至此已经烧了起来。

5月21日上午,阿里云直接抛出重磅炸弹,正面回应豆包降价:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。比豆包大模型0.0008元/千tokens低了0.0003元/千tokens。

当天下午,百度更是直接宣布文心大模型两大主力模型全面免费,立即生效。

科大讯飞也紧急跟上,第二天上午九点,官网宣布讯飞星火Lite API永久免费开放。

下午五点,向来不急的腾讯也宣布混元-lite模型,API输入输出总长度计划从目前的4k升级到256k,价格从0.008元/千tokens调整为全面免费。

至此,国内大模型头部玩家全部加入价格战。

从卷参数到卷长文本、卷Agent,再到如今卷低价,国内大模型的发展看似东一榔头,西一棒槌,什么热追什么,一家上新家家上新,实际上有一条非常清晰而明确的主线——做应用,做商业化。

而此次,各家大模型加入到价格战中,究其原因是各家都在摸索大模型商业化的路径,从整体来看,当前大模型变现的路径无非两种,C端付费,赚取普通用户的钱;B端API收费,赚取企业的钱。

就国内环境而言,用户付费意识并不强,大家看个《庆余年》还会找朋友各种借VIP和SVIP,更不要说拿一个并不完善甚至使用起来有点“鸡肋”的大模型产品让用户买单。

现在只有百度的文心一言、字节的豆包、阿里的通义千问和月之暗面的Kimi在C端市场声量较大。

文心一言早已开启用户付费模式,且定价不低,连续包年的会员费近600元,据百度最新披露,文心一言用户数突破2亿。

Kimi最近也在试水用户付费,和文心一言的订阅制不同,Kimi选择了打赏制,月之暗面之所以另辟蹊径可能与其年轻用户较多有关。

因此,B端成为各家大模型企业争夺的核心焦点。对企业来说,利用“人工智能+”发展新质生产力是大势所趋,这不是一个选择题而是一个必答题,而现实情况是,大模型太贵,模型应用成本太高。

火山引擎总裁谭待就提到:“现在大模型还是太贵了,模型的应用成本不该是这样,(通过)把成本做得更低,这样大家就能更好地做各种创新尝试,整个市场就起来了。”

有业内人士表示,今年以来大模型降价已成趋势,将进一步加速应用端的落地。

大模型似乎迎来了平价时代,但事实真的如此吗?


到底谁更具有性价比

大厂大模型API动不动厘元/千Tokens,甚至不少企业打出“免费”的口号。

那么,这些看似低价和免费的大模型,是真正地做到了“便宜好用”还是说只是获客的手段和人有我优的竞争心态在作祟。

字节此次降价的是豆包通用模型pro-32k版,模型推理输入价格为0.0008元/千Tokens。而市面上同规格模型的定价一般为0.12元/千Tokens,是豆包模型价格的150倍。

通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。Qwen-Long是通义千问的长文本增强版模型,性能对标GPT-4,上下文长度最高达1千万。

百度方面官宣的两款主力模型ERNIE Speed和ERNIE Lite 8K及128K上下文长度全部免费。

讯飞星火Lite API永久免费开放,讯飞星火顶配版(Spark3.5 Max)API价格低至0.21/万Tokens。

腾讯混元主力模型之一混元-lite模型,API输入输出总长度计划从目前的4k升级到256k,价格从0.008元/千tokens调整为全面免费。

细究下来,无论是字节、阿里的低价模型还是百度、科大讯飞和腾讯的免费模型,都是偏轻量化的模型版本,核心的大规模、高性能模型并没有卷入到此次价格战中。

这次看似热闹和非理智性价格战背后更多的似乎是大模型厂商想用“互联网”时代的打法来吸引更多TOB客户以及开发者。

其实从另一个视角看,此次“低价”既是大厂们获客的“鱼饵”,也是做大池塘的“营养素”。

水大鱼大,如果回看互联网的发展史,我们会发现,抖音真正变成一个超级应用是在苹果手机推出几年之后,它出现的时间点一个是4G的普及,另一个是安卓千元机的普及。

任何新技术浪潮来了之后,刚开始并不完善,需要达到一个临界点后才能爆发,而这个点的核心就是普惠点。

对于大模型来说,大模型想要落地,想要快速进到“价值创造阶段”,得先让大家能够用得起。

**

一切为了商业化?

实际上,随着技术发展模型推理价格降低是可以预见的必然结果。大模型现在还在初期阶段,远没有到激烈竞争的程度,模型的推理成本未来一定会继续下降。

例如,豆包大模型采用分布式推理及混合调度,发挥各种异构算力,解决推理算力的问题,进而降低模型推理成本;腾讯混元大模型采用混合专家模型 (MoE)结构,自研 Angel 机器学习平台,训练速度达到主流框架的2.6倍,推理成本相比业界主流框架下降70%。

最近在微软Build开发者大会上,纳德拉也提到,过去一年GPT-4性能提升了6倍,但成本降低到了之前的1/12,对应性能/成本提升了70倍。

李开复在最近的媒体采访中谈到:“我觉得一定程度整个行业每年降低10倍推理成本是可以期待的,而且必然也应该发生的。”

谈及降价原因,一方面,字节和阿里云都表示希望降价能够加速AI应用的爆发。

目前,大模型应用发展仍处于早期阶段,并没有出圈的爆款应用。QuestMobile数据显示,截至今年3月,基于大模型的AIGC行业用户量为7380万,尽管同比增长了8倍,也仅占移动互联网用户量的6%。

因此,通过降低价格,企业希望能够吸引更多的开发者和用户参与进来,共同推动AI应用的普及和发展。

猎豹移动董事长兼CEO傅盛也表达了类似的看法,他认为,降价目的不是为了用户更多地直接使用,而是为了吸引开发者。现在各大模型App基本都免费,但用户量涨不动了,大家都认识到仅提供聊天窗口不可能让用户越用越多,必须让开发者参与进来。

有网友调侃,大模型降价,压力给到应用端,看谁先弄出应用,先引领客户AI转型升级。

在李彦宏看来,AI应用与基础大模型的发展相辅相成。“应用的进步,可以推动基础模型的创新,也有助于加快从互联网时代向人工智能时代的转变。”

另一方面大模型作为AI的核心基础设施,各大企业都希望通过低价或免费来快速占领市场,构建生态,形成用户依赖。

据预测,中国所有大模型公司API的日调用量将在年底增长百倍,从目前的不到一个亿增长到100亿次。这一巨大的增长潜力,各家都不想错过。

此外,其实从另一个角度看,此次价格战之所以能打起来,且价格拉不开差距,是因为各家技术路径难以拉开差距。

模型的能力以及后续的服务和体验依然是大模型能否成功的重要因素。百度方面曾表示,“使用大模型不应该只看价格,更要看综合效果,只有让AI应用效果更好、响应速度更快、分发渠道更广,才能让人们切实感受AI为社会生产带来的便利。”

如果仅是为了低价而降价,那么很可能会陷入OFO式的价格战打法,最终落得两败俱伤。


大模型卷低价,初创公司伤不起

大厂大模型价格战打得火热,初创公司静悄悄,虽然也有DeepSeek和智谱AI入场,但绝大部分大模型初创公司并没有加入此次降价潮。

李开复明确表示,将不会参与价格战。并且认为,100万个token花十几块还是花几块钱并没有很大差别,对要求最高的,需求最高的,大家还是会选最好的模型。

王小川也认为,降价不是创业公司的事,百川并不会“掺和”到价格战当中。

他解释说,当前To B并不是百川的主要商业模式,价格战对其影响有限,百川更多的精力,还是会放在超级应用当中。

诚然,各家初创公司定位各不相同,价格战对他们的影响程度不尽相同。然而,一个不争的事实是,价格战势必会导致资源往少数头部企业集中,对于初创企业而言,会面临更大的成本压力,需要寻找新的商业模式实现可持续发展。

傅盛表达了同样的担忧,他认为,这次大降价基本宣告了大模型创业公司必须寻找新的商业模式,降的最凶的都是有云服务的大公司,通过大模型来获取云客户,羊毛出在猪身上,降得起。大模型创业公司没有这样的生态,必须另寻商业模式。

无论是百度、阿里、腾讯还是字节,他们降价的背后都有“公共云+大模型API”带来的边际成本的降低,而对于初创公司来说,无论是烧钱能力还是其他都无法与之抗衡。

通常价格战和泡沫一同出现,价格战在某些情况下往往会挤掉一些泡沫,滴滴、OFO等等价格战不是挤掉了规模较小、资金不充裕的竞争对手,就是挤掉了自己。

正如王小川所说,价格降低是优势但不一定是竞争力,价格战会加速泡沫周期,尾部公司可能会消失。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值