又一家国产厂商的大模型API官宣免费!还能免费微调,囤卡的哭了

“你们为啥囤卡啊?你们又不训大模型底座...”
“因为我们要微调啊”

去年我跟一个创业的朋友聊起来,他们还没有产品,就已经先囤了一波显卡。

今年奔着微调目的去囤卡的创业狗都哭了,倒不是因为搭建微调的软硬件环境有多难受,主要是因为,大模型厂商的价格战一夜之间卷到了模型微调问题上。

不得不感叹,过去一年,大模型变得太快了。

分享一个数字,GPT-4级别的模型价格已经降了200倍了。不止如此,现在已经卷到了模型微调上。

这不,今天我在浏览各个大模型API价格的时候,发现了一个薅羊毛的细节,

图片

在智谱大模型开放平台上,已经悄悄地把GLM-4-flash系列的全部模型设置为免费了,而且,还开启了微调限时免费!!

图片

先去注册的用户能获得500万 tokens (有效期3个月)的免费资源包,都限时免费了,那经验上说,不限时免费也不远了...

想起我们为模型微调交的钱和时间,真是没有对比就没有伤害啊...

图片

免费是好事,但这免费的东西“好不好用”就是另一回事儿了。

抱着这个疑问,笔者从推理和微调效果上分别做了一波测试。

免费的GLM-4-Flash抗打吗?

我先找了个把GPT等一众国内外模型都难哭了的“经典问题”去为难它——

图片

纳尼?不敢想象,一个免费模型竟然做对了?

震惊的我去问了下同样免费的国外大模型担当(GPT-4o-mini):

图片

哇!瞬间国产自信了有没有!

图片

还有一个超出预期的地方,这次免费的GLM-4 Flash,竟然自带联网搜索能力,比如你问它人工智能领域最近一周的新闻:

图片

好家伙,敢情我套壳一下GLM-4-Flash的API就能自己手撸一个AI搜索引擎产品Demo了。

而且,我还不用花钱。

图片

微调是更大的爽点

当然了,对于在深耕AI应用落地的开发者和企业来说,免费的通用大模型虽好,但离了微调环节依然用不起来。

毕竟模型的能力跟它训练阶段见过的数据依然是强关联的。如果模型没见过企业内部知识库、垂直场景的数据,那一定还是做不到实际可落地的效果的。

在一些强依赖模型微调的场景:

比如最简单的分类在看似相同的分类任务上,不同的业务场景常常有不同的标准,必须通过微调来让模型学习个性化的分类标准。

再比如结构化输出程序员都深知结构化输出有多香某一个业务场景下就是需要某种格式的表格,比如银行里填表和工业检测里填表,就完全不一样。这里不仅包括解码阶段的语法规范,还常常涉及一些语义甚至业务逻辑层面的知识训练。要做到高可用性,微调是绕不开的。

再者还有现在企业都非常看重的行业知识、企业知识库,都是在互联网上不存在的数据,像销售话术、医疗诊断、端内数据,如果要在这些场景落地,模型要先微调学习相关的行业知识,才能更好的回答用户的问题。

工具API的调用同样是在互联网上不存在的知识,因此通用大模型往往在工具调用问题上表现的“很傻”,但其实通过少量的样本去微调一把,这种工具API调用的问题也能得到极大的改善。

从这个视角看,也不难理解为什么笔者说能傻瓜式免费微调是更大的爽点了吧!

毕竟如果你要自己微调模型,花钱买卡买机器还是小事儿,关键是软硬件环境的维护、专业人员的配置以及大模型备案等一系列的问题,都会让你觉得“这波创业简直是地狱级的难度”。

好不好试了才知道

想法虽好,但好不好用同样还是要测了才知道。

首先,笔者经过一顿测试,发现GLM-4-Flash并没有读过我们夕小瑶科技说的文章 =,=

图片

不过没关系,咱们去微调一把!

Step 0:进入开发者平台

进入智谱AI开放平台的模型微调页:
https://bigmodel.cn/console/modelft/finetuning

小白也能看懂的简单三步:

图片

开干!

Step 1:创建数据集

这里笔者把公众号近期的上百篇文章的后台数据给扒拉了下来,做成了json格式的数据集。

然后将数据集丢给智谱:

图片

Step 2:创建微调任务

图片

配置好后,注意侧边栏的消费金额!

图片

嗯!这个0元让我感觉非常舒适。

我们点击确认创建。就能在任务管理页看到任务进度啦!

图片

由于数据量不多,加上我们选了LoRA微调,分钟级的就训练完了!

图片

走,去试试效果——

图片

稳!

如果免费的500万 tokens不够,官方还新出了一个开发者pro版权益套餐,每月99元,可以享受更多的资源,flash模型每个月的微调和推理的额度分别是1000万 token,还有智谱其他大模型GLM-4、GLM-4V的额度等等。总之,主打一个字:多!

多扯几句,从今年大模型厂商的动作路径其实不难发现——

务实、去泡沫是今年的主旋律。

多扯几句,从今年大模型厂商的动作路径其实不难发现——

务实、去泡沫是今年的主旋律。

AGI不一定会来,更大规模的AI落地一定会。

今年无论做ToB还是ToC,都要仔细评估下智谱的更新节奏,踩对点,做应用落地的开发者能省下不少金钱和心力。

不说了,我去薅羊毛做应用去了。

附 GLM-4-Flash 传送门:
https://zhipuaishengchan.datasink.sensorsdata.cn/t/GA

  • 7
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值