跟大厂干起了价格战智谱AI 宣布模型全面降价

本文链接：https://blog.csdn.net/2301_77817696/article/details/139495768

在大模型的世界里，Scaling Law并没有像我们担心的那样消失，AI技术的成长反而像是坐上了一辆加速前进的过山车。智谱AI的CEO张鹏在6月5日的Open Day上兴奋地宣布：“我们的大模型技术就像吃了兴奋剂一样，创新的脚步根本停不下来，速度还越来越快呢！”

技术的飞速发展似乎还不够看头，智谱AI的价格变动更是让人眼花缭乱。记得5月的时候吗？他们刚把GLM-3 Turbo模型的调用价格从5元／百万Tokens降到了1元／百万Tokens，这简直是开启了价格跳水的新模式。然后，就在大家还在为这个惊喜合不拢嘴的时候，智谱AI又来了个全面降价的大动作。

“MaaS 2.0发布啦！”张鹏得意洋洋地说，“这次全面降价不是简单的‘价格战’游戏，而是我们通过不断的技术创新和效率提升，让成本持续下降，客户价值不断升级的结果。”看来，智谱AI不仅仅是在技术上跑得快，连价格都跑得让人追不上了！

智谱AI的 MaaS开放平台最近火得一塌糊涂，日均调用量竟然超过了400亿个tokens，API每日消费量在过去半年里像坐了火箭一样翻了五十倍。这还不过瘾，他们又搞了个大新闻，推出了升级版的MaaS 2.0，同时还玩起了价格战，让人眼花缭乱。

GLM-4-flash版本的价格直接跳水，降到了GLM-3 Turbo的十分之一。想象一下，“现在只需要1毛钱就能搞定100万 token，这100万 token足够你写两本四大名著，连《红楼梦》写两遍都花不了你几个硬币。”智谱AI的 COO张帆兴奋地说，仿佛在说，“快来抢吧！”

但等等，还有更疯狂的。为了让智谱AI的明星产品GLM-4更加亲民，他们推出了GLM-4 Air版本。这个版本性能和原版GLM-4几乎一模一样，但价格更是低到让人跌破眼镜，只要1元就能享受100万 token的服务。“我们只花了原来 1%的价格，性能却能和原版 GLM-4 肩并肩。”他们自豪地宣布，仿佛在说，“谁说天上不会掉馅饼？我们这里就有！”

智谱AI最近推出了一款名为“闪电侠”的极速版大模型，这个版本在保持效果不变的前提下，让推理速度飙升到了162%，简直就是71个token/秒的速度怪兽！想象一下，每秒钟能展示出一百多个汉字，简直比速读冠军还快！

接下来，我们的超级英雄GLM-4升级了，全新推出了GLM-4-520版本。虽然看起来只是小小的提升，但对于那些和模型打过交道的同学们来说，这就像是从超人变成了超能战士，综合能力提升了11.9%，指令遵从能力更是飞跃了18.6%。这意味着我们的模型天花板被推得更高，应用范围更广，成本更低，简直是物超所值！

智谱AI还宣布了一场模型价格的“自由落体”活动：GLM-3-Turbo价格跳水80%，GLM-4V半价销售，Cogview-3降幅接近60%，图片一张只要一毛钱。这简直是把价格打到了地板下，让所有竞争对手都望尘莫及！

在智谱AI的世界里，企业用户们，准备好被宠坏吧！我们这儿的价格和并发数，就像魔术师的帽子，一拉就能根据你的规模变大变小，变多变少。而且，我们还像变形金刚一样，变身为V0、V1、V2到V3四个版本，每个版本都有不同的超能力（也就是优惠啦）。

来，让我们偷瞄一眼，如果你成为了“尊贵的V3”会员，你能得到怎样让人眼红心跳的价格。

对于想要拥有私人派对的企业来说，智谱AI升级后的平台就像是个无需密码的宝箱，三步就能打开大宝藏：GLM-4全系列模型。

你得像个寻宝者一样，按照藏宝图（也就是模版）收集并准备你的训练数据，然后把它们扔进数据集这个大熔炉里炼金；

接着，你要像创造世界的神一样，使用平台的微调工具，创造出只属于你行业的超级大模型；

一步，把你的微调模型部署起来，如果是LoRA微调模型，直接调用就好，简单得就像是点个外卖；而全参微调模型呢，就得像个搬家公司一样，把你训练好的模型搬到私有云服务器上安家。

所以，企业用户们，你们准备好了吗？让我们一起在智谱AI的世界里，开启一场精彩绝伦的冒险之旅吧！

在模型微调的奇幻森林里，LoRA微调用其神奇的魔杖轻轻一挥，便用低廉的代价达到了令人惊叹的效果，而全参微调则像是那位勇敢探索极限的勇士，不断挑战模型微调的未知领域。在这趟奇妙旅程中，智谱AI化身为那位智慧的巫师，施展了强大的魔法：通过技术的力量，将训练成本削减到了令人瞠目结舌的87%，同时让训练速度像兔子一样跳得飞快，提高了30%；数据使用效率也得到了惊人的提升，达到了40%。

而在性价比的大比拼中，LoRA微调无疑是那位笑到最后的王者。对于GLM-4这位选手来说，每千个token只需花费区区四毛钱；而更轻盈的GLM-4-Air更是经济实惠，仅需三毛钱。就算是全力以赴的全参微调？GLM-4和GLM-4-Air也分别只需六毛和五毛钱。

在这场开源多模态模型的首次发布会上，智谱AI自豪地展示了他们的新宝贝：第四代GLM系列的明星——GLM-4-9B。这不仅仅是一个模型，它更像是一扇打开新世界的大门，邀请着每一位探险家一同踏上这段激动人心的探索之旅。

GLM-4-9B模型的诞生就像一场科学实验中的小意外，带来了意想不到的大发现。在一次普通的预训练中，团队决定给数据筛选过程添点料，加入了大语言模型这个秘密配方，结果不仅让数据的量级翻了三倍，达到了惊人的10TB，质量也是杠杠的，直接把ChatGLM3-6B模型的数据量甩在了身后。

为了确保这锅“数据汤”煮得又快又好，团队巧妙地用上了FP8技术，就像给炉子加了个强力风扇，训练效率一下子提高了3.5倍。但就在大家以为一切顺利时，团队遇到了一个小挑战：在有限的显存条件下，6B模型的表现有点力不从心，于是，他们像是在玩升级游戏一样，决定给模型规模来个大升级，直接冲到了9B，并将预训练计算量加大了5倍！

这样一来，GLM-4-9B模型就像是穿上了超级英雄的战衣，不仅推理性能强大到可以和钢铁侠一较高下，处理上下文的能力也长到可以写下一部《战争与和平》。更妙的是，它还是个多语言通、多模态高手，加上All Tools技能包，简直就是AI界的瑞士军刀，什么任务都能手到擒来。

GLM-4-9B这个模型，在中英文综合性能上，比ChatGLM3-6B厉害了整整40%！特别是在中文对齐能力、指令遵从和工程代码方面，它的提升令人眼前一亮。就算是面对训练量更大的Llama 3 8B模型，GLM-4-9B在英文上也能略胜一筹，而在中文学科上更是以惊人的50%提升领先。

说到GLM-4-9B的上下文处理能力，那可是从128K跃升到了1M tokens，意味着它能一次性搞定大约200万字的输入，这差不多是两本《红楼梦》或者125篇论文的长度呢！而且，它还支持26种语言哦。为了让模型更加高效，团队把tokenizer的词表大小从65k扩充到了150k，这一改，编码效率就提高了30%。

更有意思的是，团队在GLM-4-9B的开源仓库里放了一个All Tools Demo，这样用户就能在本地拥有一个轻量级的语言工具箱，简直就像拥有了一个随身携带的智能助手！

智谱AI最近搞了个大新闻，推出了个新玩意儿，叫做GLM-4V-9B。这可不是你家的新款电视，而是一个基于GLM基座打造的开源多模态模型。它跟CogVLM2长得挺像，能处理那些高清到爆的1120 x 1120分辨率图片，而且还能通过一种叫做“降采样”的技术，让token开销变得不那么吓人。

为了不让大家的电脑和钱包都哭出来，GLM-4V-9B决定不走寻常路，不搞什么花里胡哨的视觉专家模块，而是直接把文本和图片数据混在一起训练，这样一来，既保持了文本的性能，又提升了处理多模态的能力。

说到性能，GLM-4V-9B可真是个小钢炮。虽然只有13B的参数量，但表现却能和那些大块头媲美。在很多任务上，它都跟GPT-4V不相上下。

想知道更多？去这两个地方看看吧：

- Github：https://github.com/THUDM/GLM-4

-魔搭社区：https://modelscope.cn/organization/ZhipuAI

对于提供的网址，第一个链接指向的是Hugging Face平台的一个特定集合或模型，而第二个链接则指向魔搭社区的。这两个资源都与人工智能和机器学习的社区紧密相关，尤其是在模型和应用的开发方面。

让我们深入探讨刘慈欣和老罗在线上活动中的角色和讨论。这两位人物被邀请来不仅仅是增添活动的光彩，更是为了提供独到的见解和深度的讨论。刘慈欣作为科幻文学的大师，他对人工智能的看法尤为重要。他提出的问题关于人类的想象力是否会被AI限制或激发，是一个多层次且复杂的议题。他认为AI的依赖性可能会导致人类变得懒惰，不再愿意投入时间和努力去探索新的可能性。这种观点提示我们，技术的进步虽然是必要的，但我们也不能忽视它可能带来的负面影响。

接下来，考虑到这些讨论是在AI领域内进行的，我们可以进一步推测这些对话可能会影响未来技术的发展方向。例如，如果开发者和研究者受到这样的启发，他们可能会更加重视开发那些能够促进而非抑制人类创造力的AI系统。

通过结合科幻的视角和实际的技术实践，这类活动不仅增加了知识的广度，也加深了对技术潜在影响的理解。这种跨领域的合作模式是推动科技进步的同时，也确保了技术发展的方向能够更好地服务于人类社会的需求和福祉。

人工智能不仅能帮我们做数据分析，还能给我们的大脑来个“灵感SPA”。想象一下，AI就像是一个拥有超级大脑的图书管理员，不仅帮你整理书架，还能推荐一些你意想不到的奇妙书籍。这样一来，我们的想象力就更像大，像打鸡血一样，跳起舞来了！

不过，别以为AI就只是个图书馆员，它还能像个疯狂的科学家一样，提出一些让你大跌眼镜的新想法。是的，你没听错，AI有时候比我们还敢想！

但是，就像吃薯片不能只吃不运动一样，我们不能光依赖AI。刘慈欣大佬说得好：“在未来，当AI比我们聪明的时候，咱们人类唯一的优势可能就是——想象力。”所以，大家快去锻炼脑力吧！

罗永浩的AI版——AI老罗，已经在智谱清言App里安家了，工号001哦！他可是向所有人开放的，说不定哪天你跟他聊天，就能激发出下一个伟大发明呢！

昨晚的直播界上演了一出“真假罗永浩”大戏，观众们瞪大了眼睛，怀疑屏幕上那位侃侃而谈的家伙是不是被AI掉包了。面对这种“身份危机”，老罗展现了他的霸气侧漏，一句“是什么就是什么，AI就要标明是AI”不仅否认了AI替身的可能性，还顺带教育了大家：诚信经营，标签要清晰！这波操作，简直比直播带货还要精彩，让人忍不住想问：老罗，你是来卖货的，还是来卖萌的？