正面硬刚OpenAI!智谱AI推出第三代基座模型,功能对标GPT-4V,代码解释器随便玩...

衡宇 萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

国产大模型估值最高创企,为何是智谱AI

仅用4个月时间,这家公司就甩出最新成绩证明了自己——

自研大模型ChatGLM3,不止是底层架构,就连模型功能都进行了全方位大升级。

性能上,最直观的表现就是“疯狂屠榜”,所有50个大模型公开性能测评数据集中,拿下44个全国第一

产品上,率先搞定了用户关注度MAX的代码解释器功能,能生成甚至直接跑通代码!

现在这个新功能已经人人可玩,我们也试着用它给大伙儿比了个心daeff0ed4817ad6b23e1b320cd8cc5c4.png

c451807274ae7fbbfa70b5ae0e94a1bd.gif

值得一提的是,这个功能也是国内首家

2391278a2767df032f1723574b03f6fb.png

所以,从智谱AI发布的ChatGLM3中,究竟能深挖出什么最新的技术细节?

行业又能否从中嗅出什么大模型新动向?

我们从智谱AI的ChatGLM3发布会中一探究竟。

ChatGLM3长啥样?

稍早之前,量子位就获悉了智谱AI将发布迭代后基座模型的消息,取名ChatGLM3

发布会上,升级后的ChatGLM第三代正式对外披露,主要在4个方面秀出亮点,对比上一代有不小提升。

首先是性能的提升

据介绍,结合此前ChatGLM系列模型的开发经验,智谱AI采用了独创的多阶段增强与训练方法,同时丰富了训练数据,优化了训练方法,使训练更为充分。

评测结果显示,与ChatGLM2系列模型相比,ChatGLM3一出,性能屠榜:

同尺寸模型中,ChatGLM3拿下了44个中英文公开数据集测试国内第一

66cd3a28f56e3bef3e64c8de78787edd.png

其次是推理能力方面,更为高效,成本也更低

官方介绍,ChatGLM3系列模型采用了最新的高效动态推理和显存优化技术。

相同硬件、模型条件下,当前的推理框架相较于目前的最佳开源实现——UC伯克利分校提出的vLLM以及Hugging Face TGI的最新版本,推理速度提升了2-3倍。

同时成本降低一倍。目前ChatGLM3系列模型的推理成本,每千tokens仅需要0.5分

1bfa3cb6f62e76b65bf1800a70ebd0e0.png

以及ChatGLM3还具备了全新的Agent智能体能力

智谱AI介绍说,本次迭代后的ChatGLM3集成了自研的AgentTuning技术,激活了模型智能代理能力。

由此也使得ChatGLM3作为国产大模型,能够原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值