迈向普惠AI的「一小步」:GLM-4-Flash,免费!

点击蓝字

a539352097fee2e913e1b7c5650fd9f8.jpeg

关注我们

AI TIME欢迎每一位AI爱好者的加入!

转载来源:BigModel.CN 智谱AI 开放平台

在大型模型技术持续进步的背景下,我们郑重地宣布:GLM-4-Flash 免费开放给所有人。现在只需要注册开放平台 bigmodel.cn 就可以通过调用 GLM-4-Flash 快速、免费地构建你的专属模型和应用。

体验地址:

https://bigmodel.cn/console/trialcenter?modelCode=glm-4-flash

模型微调:

https://bigmodel.cn/console/modelft/finetuning/create/glm-4-flash

说明文档:

https://open.bigmodel.cn/dev/api#glm-4

01

GLM-4-Flash 可以帮你做什么?

GLM-4-Flash 兼具“高速度”和“经济性”两大特点,适用于完成简单垂直、低成本、需要快速响应的任务。

在能力方面,GLM-4-Flash 具备多轮对话、网页浏览、Function Call 和长文本推理(支持最大 128K 上下文)等高级功能,同时支持包括中文、英语、日语、韩语、德语在内的 26 种语言。在科研数据预处理、信息抽取、多语种翻译、多轮对话中展现了易用性和便利性。

· 数据抽取:生物学家使用 GLM-4-Flash 处理分子数据,破解健康密码;

· 数据生成:使用 GLM-4-Flash 生成可以训练其他大模型的数据内容,让 GLM-4-Flash 成为其他领域大模型的 “黄埔军校” ;

· 多轮对话:高校学者正使用 GLM-4-Flash 制作 AI 助教,让每个学生都有学习和校园生活的伙伴;有的开发者还将模型应用于虚拟人对话场景;

· 英语翻译:开发者使用 GLM-4-Flash 构建翻译 APP,帮助小朋友进行英语互动性学习;

· 内容生成:广告公司使用 GLM-4-Flash 做文本润色,帮助编辑和文案快速输出各种类型的文案。

我们相信,随着 GLM-4-Flash 完全免费,未来将催生出更多基于大模型的应用和创新。

02

免费背后的技术逻辑?

我们通过多种方式优化大模型运行效率。开放平台采用自适应权重量化、多种并行化方式、批处理策略以及投机采样等多种方法,在推理层面实现模型的延迟降低与速度提升,更大并发量和吞吐量不仅提升了效率,而且让推理成本显著降低。

在预训练方面,我们引入了大语言模型进入数据筛选流程,最终获得了 10T 高质量多语言数据,数据量是 ChatGLM3-6B 模型的 3 倍以上;同时,我们采用了 FP8 技术进行高效的预训练,显著提高了训练效率和计算量。

03

GLM-4-Flash 能力矩阵

1. 推理能力

逻辑推理能力往往是衡量模型性能的重要标准,其决定了模型在求解数学题、完成复杂任务等方面上的能力。GLM-4-Flash 在中英文性能上表现出色。在这里,我们选择了一道逻辑推理题来让模型进行推理,从而对比三个模型的逻辑推理能力。原题如下:

有一个很古老的村子,这个村子的人分两种,红眼睛和蓝眼睛,这两种人并没有什么不同,小孩在没生出来之前,没人知道他是什么颜色的眼睛,这个村子中间有一个广场,是村民们聚集的地方,现在这个村子只有三个人,分住三处。在这个村子,有一个规定,就是如果一个人能知道自己眼睛的颜色并且在晚上自杀的话,他就会升入天堂,这三个人不能够用语言告诉对方眼睛的颜色,也不能用任何方式提示对方的眼睛是什么颜色,而且也不能用镜子、水等一切有反光的物质来看到自己眼睛的颜色,当然,他们不是瞎子,他们能看到对方的眼睛,但就是不能告诉他!他们只能用思想来思考,于是他们每天就一大早来到广场上,面对面的傻坐着,想自己眼睛的颜色,一天天过去了,一点进展也没有。直到有一天,来了一个外地人,他到广场上说了一句话,改变了他们的命运,他说,你们之中至少有一个人的眼睛是红色的。说完就走了。这三个人听了之后,又面对面的坐到晚上才回去睡觉,第二天,他们又来到广场,又坐了一天。当天晚上,就有两个人成功的自杀了!第三天,当最后一个人来到广场,看到那两个人没来,知道他们成功的自杀了,于是他也回去,当天晚上,也成功的自杀了!根据以上,请说出三个人的眼睛的颜色,并能够说出推理过程!

从结果可以看到,GLM-4-Flash 完美解决逻辑推理题,展示了其逻辑推理能力。

849ae6e1c3a885debd4ce8fd7ec1e962.png

2. 生成速度

GLM-4-Flash 生成速度快,能达到 72.14 token/s,约等于 115 字符/s。

在一项来自科技博主「赛博禅心」的模型速度测试中,给定模型的任务是将《出师表》翻译成现代汉语:

#测试 prompt:将以下内容,翻译成现代汉语:先帝创业未半而中道崩殂,今天下三分,益州疲弊,此诚危急存亡之秋也。然侍卫之臣不懈于内,忠志之士忘身于外者,盖追先帝之殊遇,欲报之于陛下也。诚宜开张圣听,以光先帝遗德,恢弘志士之气,不宜妄自菲薄,引喻失义,以塞忠谏之路也。宫中府中,俱为一体,陟罚臧否,不宜异同。若有作奸犯科及为忠善者,宜付有司论其刑赏,以昭陛下平明之理,不宜偏私,使内外异法也。侍中、侍郎郭攸之、费祎、董允等,此皆良实,志虑忠纯,是以先帝简拔以遗陛下。愚以为宫中之事,事无大小,悉以咨之,然后施行,必能裨补阙漏,有所广益。将军向宠,性行淑均,晓畅军事,试用于昔日,先帝称之曰能,是以众议举宠为督。愚以为营中之事,悉以咨之,必能使行阵和睦,优劣得所。亲贤臣,远小人,此先汉所以兴隆也;亲小人,远贤臣,此后汉所以倾颓也。先帝在时,每与臣论此事,未尝不叹息痛恨于桓、灵也。侍中、尚书、长史、参军,此悉贞良死节之臣,愿陛下亲之信之,则汉室之隆,可计日而待也。臣本布衣,躬耕于南阳,苟全性命于乱世,不求闻达于诸侯。先帝不以臣卑鄙,猥自枉屈,三顾臣于草庐之中,咨臣以当世之事,由是感激,遂许先帝以驱驰。后值倾覆,受任于败军之际,奉命于危难之间,尔来二十有一年矣。先帝知臣谨慎,故临崩寄臣以大事也。受命以来,夙夜忧叹,恐托付不效,以伤先帝之明,故五月渡泸,深入不毛。今南方已定,兵甲已足,当奖率三军,北定中原,庶竭驽钝,攘除奸凶,兴复汉室,还于旧都。此臣所以报先帝而忠陛下之职分也。至于斟酌损益,进尽忠言,则攸之、祎、允之任也。愿陛下托臣以讨贼兴复之效,不效,则治臣之罪,以告先帝之灵。若无兴德之言,则责攸之、祎、允等之慢,以彰其咎;陛下亦宜自谋,以咨诹善道,察纳雅言,深追先帝遗诏,臣不胜受恩感激。今当远离,临表涕零,不知所言。

从结果中可以看到,GLM-4-Flash 的生成速度紧随 GPT-3.5-turbo(83.42 token/s),远远高于其他模型,比如 Qwen-turbo(43.99 token/s)、Baichuan3-Turbo (36.36 token/s)。

a5ee52956278211c26210f4df98847f9.png

3. 网页检索

GLM-4-Flash 具备网页检索的能力,能实时访问天气、新闻等信息。例如,可以向它询问最近一周关于 AI 领域的新闻,它能随即对网页进行检索,并给出相应的回答。

8dd56bdba5069bd5b57e53c76201e22d.png

4. 函数调用

另外,在函数调用方面,GLM-4-Flash 能对函数进行调用,其功能调用能力与 GPT-4 相当。

04

微调资源包福利

智谱AI 开放平台期待得到更多来自您的真实反馈~ 除了模型免费之外,我们也针对 GLM-4-Flash 提供了限时免费微调福利:完成以下调查问卷,您将获得 500万 Tokens(3个月)训练资源包,名额限量 2000 位,先到先得!

b37aa99b99a3fa52f8eabc4d2f7bf24c.jpeg

我们深信,AI 的力量应该惠及所有人群,无论你是否身在 AI 行业,无论你是经验丰富的开发者,还是科研领域的青年学者,无论你在世界的哪个角落,都能平等地利用我们的 AI 技术,解决实际问题,创造新的可能。

我们诚邀业内开发者以及相关人员前来体验GLM-4-Flash,解锁更多大模型应用场景,共同构建繁荣的大模型生态,加速推进普惠 AI 的愿景。

往期精彩文章推荐

c7dd3af843366a5de497982cd81bf392.png

ACL2024 杰出论文 | LM-Steer:给语言模型加上一个方向盘

 关于AI TIME 

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了1800多位海内外讲者,举办了逾600场活动,超700万人次观看。

 b0ac6cb7d03d1b9e74756b139ea8e379.png

我知道你

在看

提出观点,表达想法,欢迎

留言

50937db60fb19660b986dba5313cb9ab.gif

点击 阅读原文 查看更多!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值