衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
国产大模型玩家智谱AI,交出最新成绩单——
发布全自研第四代基座大模型GLM-4,且所有更新迭代的能力全量上线。
作为国内唯一一个产品线全对标OpenAI的大模型公司,智谱年前攒了波大的:
按官方说法,GLM-4性能相比GLM-3提升60%,逼近GPT-4(11月6日最新版本效果)。
而同时推出的GLM-4-All Tools,能够完成用户意图理解-复杂指令规划-自由调用GLM生态的多种模型能力。
值得一提的是,智谱发布了GLMs,为所有开发者提供AI智能体定制能力,简单prompt指令就能创建个性化GLM智能体。
之前,智谱CEO张鹏就明确过:
OpenAI摸着石头过河,我们摸着OpenAI过河。
摸来摸去摸了一年,以每3-4个月升级一次基座模型的速度,智谱摸着OpenAI过河的最新成绩到底怎么样?真如所说吗?
当官方用上“可对比”“对标”“追平”等字眼后,智谱接下来的路又会怎么走?
好奇,感兴趣,想知道。
(我猜你们也是)。
所以,发布GLM-4的智谱AI技术开放日现场,我们替没到场的小伙伴听了、看了;满肚子的问题,我们也帮大家抓住张鹏问了。
GO——
“摸着OpenAI”,路走成什么样了?
智谱为什么敢喊出“逼近”甚至部分超过GPT-4?
老规矩,直接一起看GLM-4的现场演示:
首先来看整体性能。
基础能力方面,张鹏在现场介绍了GLM-4在各项评测集上的最终得分。
MMLU:81.5,达到GPT-4的94%水平;