又一家国产厂商的大模型API官宣免费！还能免费微调，囤卡的哭了

夕小瑶

于 2024-08-27 23:13:23 发布

阅读量1.3k

点赞数 17

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xixiaoyaoww/article/details/141614784

版权

“你们为啥囤卡啊？你们又不训大模型底座...”
“因为我们要微调啊”

去年我跟一个创业的朋友聊起来，他们还没有产品，就已经先囤了一波显卡。

今年奔着微调目的去囤卡的创业狗都哭了，倒不是因为搭建微调的软硬件环境有多难受，主要是因为，大模型厂商的价格战一夜之间卷到了模型微调问题上。

不得不感叹，过去一年，大模型变得太快了。

分享一个数字，GPT-4级别的模型价格已经降了200倍了。不止如此，现在已经卷到了模型微调上。

这不，今天我在浏览各个大模型API价格的时候，发现了一个薅羊毛的细节，

在智谱大模型开放平台上，已经悄悄地把GLM-4-flash系列的全部模型设置为免费了，而且，还开启了微调限时免费！！

先去注册的用户能获得500万 tokens （有效期3个月）的免费资源包，都限时免费了，那经验上说，不限时免费也不远了...

想起我们为模型微调交的钱和时间，真是没有对比就没有伤害啊...

免费是好事，但这免费的东西“好不好用”就是另一回事儿了。

抱着这个疑问，笔者从推理和微调效果上分别做了一波测试。

免费的GLM-4-Flash抗打吗？

我先找了个把GPT等一众国内外模型都难哭了的“经典问题”去为难它——

纳尼？不敢想象，一个免费模型竟然做对了？

震惊的我去问了下同样免费的国外大模型担当（GPT-4o-mini）：

哇！瞬间国产自信了有没有！

还有一个超出预期的地方，这次免费的GLM-4 Flash，竟然自带联网搜索能力，比如你问它人工智能领域最近一周的新闻：

好家伙，敢情我套壳一下GLM-4-Flash的API就能自己手撸一个AI搜索引擎产品Demo了。

而且，我还不用花钱。

微调是更大的爽点

当然了，对于在深耕AI应用落地的开发者和企业来说，免费的通用大模型虽好，但离了微调环节依然用不起来。

毕竟模型的能力跟它训练阶段见过的数据依然是强关联的。如果模型没见过企业内部知识库、垂直场景的数据，那一定还是做不到实际可落地的效果的。

在一些强依赖模型微调的场景：

比如最简单的分类，在看似相同的分类任务上，不同的业务场景常常有不同的标准，必须通过微调来让模型学习个性化的分类标准。

再比如结构化输出，程序员都深知结构化输出有多香。某一个业务场景下就是需要某种格式的表格，比如银行里填表和工业检测里填表，就完全不一样。这里不仅包括解码阶段的语法规范，还常常涉及一些语义甚至业务逻辑层面的知识训练。要做到高可用性，微调是绕不开的。

再者还有现在企业都非常看重的行业知识、企业知识库，都是在互联网上不存在的数据，像销售话术、医疗诊断、端内数据，如果要在这些场景落地，模型要先微调学习相关的行业知识，才能更好的回答用户的问题。

工具API的调用同样是在互联网上不存在的知识，因此通用大模型往往在工具调用问题上表现的“很傻”，但其实通过少量的样本去微调一把，这种工具API调用的问题也能得到极大的改善。

从这个视角看，也不难理解为什么笔者说能傻瓜式免费微调是更大的爽点了吧！

毕竟如果你要自己微调模型，花钱买卡买机器还是小事儿，关键是软硬件环境的维护、专业人员的配置以及大模型备案等一系列的问题，都会让你觉得“这波创业简直是地狱级的难度”。

好不好试了才知道

想法虽好，但好不好用同样还是要测了才知道。

首先，笔者经过一顿测试，发现GLM-4-Flash并没有读过我们夕小瑶科技说的文章 =，=

不过没关系，咱们去微调一把！

Step 0：进入开发者平台

进入智谱AI开放平台的模型微调页：
https://bigmodel.cn/console/modelft/finetuning

小白也能看懂的简单三步：

开干！

Step 1：创建数据集

这里笔者把公众号近期的上百篇文章的后台数据给扒拉了下来，做成了json格式的数据集。

然后将数据集丢给智谱：

Step 2：创建微调任务

配置好后，注意侧边栏的消费金额！

嗯！这个0元让我感觉非常舒适。

我们点击确认创建。就能在任务管理页看到任务进度啦！

由于数据量不多，加上我们选了LoRA微调，分钟级的就训练完了！

走，去试试效果——

稳！

如果免费的500万 tokens不够，官方还新出了一个开发者pro版权益套餐，每月99元，可以享受更多的资源，flash模型每个月的微调和推理的额度分别是1000万 token，还有智谱其他大模型GLM-4、GLM-4V的额度等等。总之，主打一个字：多！

多扯几句，从今年大模型厂商的动作路径其实不难发现——

务实、去泡沫是今年的主旋律。

多扯几句，从今年大模型厂商的动作路径其实不难发现——

务实、去泡沫是今年的主旋律。

AGI不一定会来，更大规模的AI落地一定会。

今年无论做ToB还是ToC，都要仔细评估下智谱的更新节奏，踩对点，做应用落地的开发者能省下不少金钱和心力。

不说了，我去薅羊毛做应用去了。

附 GLM-4-Flash 传送门：
https://zhipuaishengchan.datasink.sensorsdata.cn/t/GA

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。