跟大厂干起了价格战智谱AI 宣布模型全面降价

4 篇文章 0 订阅
2 篇文章 0 订阅

在大模型的世界里,Scaling Law并没有像我们担心的那样消失,AI技术的成长反而像是坐上了一辆加速前进的过山车。智谱AI的CEO张鹏在6月5日的Open Day上兴奋地宣布:“我们的大模型技术就像吃了兴奋剂一样,创新的脚步根本停不下来,速度还越来越快呢!”

技术的飞速发展似乎还不够看头,智谱AI的价格变动更是让人眼花缭乱。记得5月的时候吗?他们刚把GLM-3 Turbo模型的调用价格从5元/百万Tokens降到了1元/百万Tokens,这简直是开启了价格跳水的新模式。然后,就在大家还在为这个惊喜合不拢嘴的时候,智谱AI又来了个全面降价的大动作。

“MaaS 2.0发布啦!”张鹏得意洋洋地说,“这次全面降价不是简单的‘价格战’游戏,而是我们通过不断的技术创新和效率提升,让成本持续下降,客户价值不断升级的结果。”看来,智谱AI不仅仅是在技术上跑得快,连价格都跑得让人追不上了!

智谱AI的 MaaS开放平台最近火得一塌糊涂,日均调用量竟然超过了400亿个tokens,API每日消费量在过去半年里像坐了火箭一样翻了五十倍。这还不过瘾,他们又搞了个大新闻,推出了升级版的MaaS 2.0,同时还玩起了价格战,让人眼花缭乱。

GLM-4-flash版本的价格直接跳水,降到了GLM-3 Turbo的十分之一。想象一下,“现在只需要1毛钱就能搞定100万 token,这100万 token足够你写两本四大名著,连《红楼梦》写两遍都花不了你几个硬币。”智谱AI的 COO张帆兴奋地说,仿佛在说,“快来抢吧!”

但等等,还有更疯狂的。为了让智谱AI的明星产品GLM-4更加亲民,他们推出了GLM-4 Air版本。这个版本性能和原版GLM-4几乎一模一样,但价格更是低到让人跌破眼镜,只要1元就能享受100万 token的服务。“我们只花了原来 1%的价格,性能却能和原版 GLM-4 肩并肩。”他们自豪地宣布,仿佛在说,“谁说天上不会掉馅饼?我们这里就有!”9596fe6c8f0aa83277253542ec2adf4d.jpeg

智谱AI最近推出了一款名为“闪电侠”的极速版大模型,这个版本在保持效果不变的前提下,让推理速度飙升到了162%,简直就是71个token/秒的速度怪兽!想象一下,每秒钟能展示出一百多个汉字,简直比速读冠军还快!

接下来,我们的超级英雄GLM-4升级了,全新推出了GLM-4-520版本。虽然看起来只是小小的提升,但对于那些和模型打过交道的同学们来说,这就像是从超人变成了超能战士,综合能力提升了11.9%,指令遵从能力更是飞跃了18.6%。这意味着我们的模型天花板被推得更高,应用范围更广,成本更低,简直是物超所值!

智谱AI还宣布了一场模型价格的“自由落体”活动:GLM-3-Turbo价格跳水80%,GLM-4V半价销售,Cogview-3降幅接近60%,图片一张只要一毛钱。这简直是把价格打到了地板下,让所有竞争对手都望尘莫及!

在智谱AI的世界里,企业用户们,准备好被宠坏吧!我们这儿的价格和并发数,就像魔术师的帽子,一拉就能根据你的规模变大变小,变多变少。而且,我们还像变形金刚一样,变身为V0、V1、V2到V3四个版本,每个版本都有不同的超能力(也就是优惠啦)。bf1741184451660bb3778cc2c65fc0b3.jpeg

来,让我们偷瞄一眼,如果你成为了“尊贵的V3”会员,你能得到怎样让人眼红心跳的价格。22ed75bf5f3b8b13627815d22d37113e.jpeg

对于想要拥有私人派对的企业来说,智谱AI升级后的平台就像是个无需密码的宝箱,三步就能打开大宝藏:GLM-4全系列模型。

你得像个寻宝者一样,按照藏宝图(也就是模版)收集并准备你的训练数据,然后把它们扔进数据集这个大熔炉里炼金;

接着,你要像创造世界的神一样,使用平台的微调工具,创造出只属于你行业的超级大模型;

一步,把你的微调模型部署起来,如果是LoRA微调模型,直接调用就好,简单得就像是点个外卖;而全参微调模型呢,就得像个搬家公司一样,把你训练好的模型搬到私有云服务器上安家。f9b69ff5e3559358e0920043300140a1.jpeg

所以,企业用户们,你们准备好了吗?让我们一起在智谱AI的世界里,开启一场精彩绝伦的冒险之旅吧!

在模型微调的奇幻森林里,LoRA微调用其神奇的魔杖轻轻一挥,便用低廉的代价达到了令人惊叹的效果,而全参微调则像是那位勇敢探索极限的勇士,不断挑战模型微调的未知领域。在这趟奇妙旅程中,智谱AI化身为那位智慧的巫师,施展了强大的魔法:通过技术的力量,将训练成本削减到了令人瞠目结舌的87%,同时让训练速度像兔子一样跳得飞快,提高了30%;数据使用效率也得到了惊人的提升,达到了40%。

而在性价比的大比拼中,LoRA微调无疑是那位笑到最后的王者。对于GLM-4这位选手来说,每千个token只需花费区区四毛钱;而更轻盈的GLM-4-Air更是经济实惠,仅需三毛钱。就算是全力以赴的全参微调?GLM-4和GLM-4-Air也分别只需六毛和五毛钱。

在这场开源多模态模型的首次发布会上,智谱AI自豪地展示了他们的新宝贝:第四代GLM系列的明星——GLM-4-9B。这不仅仅是一个模型,它更像是一扇打开新世界的大门,邀请着每一位探险家一同踏上这段激动人心的探索之旅。a2cd58d441ab8a4de1c4c510806a8ec4.jpeg

GLM-4-9B模型的诞生就像一场科学实验中的小意外,带来了意想不到的大发现。在一次普通的预训练中,团队决定给数据筛选过程添点料,加入了大语言模型这个秘密配方,结果不仅让数据的量级翻了三倍,达到了惊人的10TB,质量也是杠杠的,直接把ChatGLM3-6B模型的数据量甩在了身后。

为了确保这锅“数据汤”煮得又快又好,团队巧妙地用上了FP8技术,就像给炉子加了个强力风扇,训练效率一下子提高了3.5倍。但就在大家以为一切顺利时,团队遇到了一个小挑战:在有限的显存条件下,6B模型的表现有点力不从心,于是,他们像是在玩升级游戏一样,决定给模型规模来个大升级,直接冲到了9B,并将预训练计算量加大了5倍!

这样一来,GLM-4-9B模型就像是穿上了超级英雄的战衣,不仅推理性能强大到可以和钢铁侠一较高下,处理上下文的能力也长到可以写下一部《战争与和平》。更妙的是,它还是个多语言通、多模态高手,加上All Tools技能包,简直就是AI界的瑞士军刀,什么任务都能手到擒来。

GLM-4-9B这个模型,在中英文综合性能上,比ChatGLM3-6B厉害了整整40%!特别是在中文对齐能力、指令遵从和工程代码方面,它的提升令人眼前一亮。就算是面对训练量更大的Llama 3 8B模型,GLM-4-9B在英文上也能略胜一筹,而在中文学科上更是以惊人的50%提升领先。

说到GLM-4-9B的上下文处理能力,那可是从128K跃升到了1M tokens,意味着它能一次性搞定大约200万字的输入,这差不多是两本《红楼梦》或者125篇论文的长度呢!而且,它还支持26种语言哦。为了让模型更加高效,团队把tokenizer的词表大小从65k扩充到了150k,这一改,编码效率就提高了30%。

更有意思的是,团队在GLM-4-9B的开源仓库里放了一个All Tools Demo,这样用户就能在本地拥有一个轻量级的语言工具箱,简直就像拥有了一个随身携带的智能助手!

智谱AI最近搞了个大新闻,推出了个新玩意儿,叫做GLM-4V-9B。这可不是你家的新款电视,而是一个基于GLM基座打造的开源多模态模型。它跟CogVLM2长得挺像,能处理那些高清到爆的1120 x 1120分辨率图片,而且还能通过一种叫做“降采样”的技术,让token开销变得不那么吓人。9eab6032e027dc2fa2838580dcf34fc4.jpeg

为了不让大家的电脑和钱包都哭出来,GLM-4V-9B决定不走寻常路,不搞什么花里胡哨的视觉专家模块,而是直接把文本和图片数据混在一起训练,这样一来,既保持了文本的性能,又提升了处理多模态的能力。

说到性能,GLM-4V-9B可真是个小钢炮。虽然只有13B的参数量,但表现却能和那些大块头媲美。在很多任务上,它都跟GPT-4V不相上下。c075afc4f4e073e8af7ffb48c0357d22.jpeg

想知道更多?去这两个地方看看吧:

- Github:https://github.com/THUDM/GLM-4

-魔搭社区:https://modelscope.cn/organization/ZhipuAI

对于提供的网址,第一个链接指向的是Hugging Face平台的一个特定集合或模型,而第二个链接则指向魔搭社区的。这两个资源都与人工智能和机器学习的社区紧密相关,尤其是在模型和应用的开发方面。

让我们深入探讨刘慈欣和老罗在线上活动中的角色和讨论。这两位人物被邀请来不仅仅是增添活动的光彩,更是为了提供独到的见解和深度的讨论。刘慈欣作为科幻文学的大师,他对人工智能的看法尤为重要。他提出的问题关于人类的想象力是否会被AI限制或激发,是一个多层次且复杂的议题。他认为AI的依赖性可能会导致人类变得懒惰,不再愿意投入时间和努力去探索新的可能性。这种观点提示我们,技术的进步虽然是必要的,但我们也不能忽视它可能带来的负面影响。7e63e248662e5fbb163930c1dccd26c6.jpeg

接下来,考虑到这些讨论是在AI领域内进行的,我们可以进一步推测这些对话可能会影响未来技术的发展方向。例如,如果开发者和研究者受到这样的启发,他们可能会更加重视开发那些能够促进而非抑制人类创造力的AI系统。

通过结合科幻的视角和实际的技术实践,这类活动不仅增加了知识的广度,也加深了对技术潜在影响的理解。这种跨领域的合作模式是推动科技进步的同时,也确保了技术发展的方向能够更好地服务于人类社会的需求和福祉。

人工智能不仅能帮我们做数据分析,还能给我们的大脑来个“灵感SPA”。想象一下,AI就像是一个拥有超级大脑的图书管理员,不仅帮你整理书架,还能推荐一些你意想不到的奇妙书籍。这样一来,我们的想象力就更像大,像打鸡血一样,跳起舞来了!

不过,别以为AI就只是个图书馆员,它还能像个疯狂的科学家一样,提出一些让你大跌眼镜的新想法。是的,你没听错,AI有时候比我们还敢想!

但是,就像吃薯片不能只吃不运动一样,我们不能光依赖AI。刘慈欣大佬说得好:“在未来,当AI比我们聪明的时候,咱们人类唯一的优势可能就是——想象力。”所以,大家快去锻炼脑力吧!

罗永浩的AI版——AI老罗,已经在智谱清言App里安家了,工号001哦!他可是向所有人开放的,说不定哪天你跟他聊天,就能激发出下一个伟大发明呢!

昨晚的直播界上演了一出“真假罗永浩”大戏,观众们瞪大了眼睛,怀疑屏幕上那位侃侃而谈的家伙是不是被AI掉包了。面对这种“身份危机”,老罗展现了他的霸气侧漏,一句“是什么就是什么,AI就要标明是AI”不仅否认了AI替身的可能性,还顺带教育了大家:诚信经营,标签要清晰!这波操作,简直比直播带货还要精彩,让人忍不住想问:老罗,你是来卖货的,还是来卖萌的?


  • 24
    点赞
  • 34
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值