正面硬刚OpenAI！智谱AI推出第三代基座模型，功能对标GPT-4V，代码解释器随便玩...

QbitAl

于 2023-10-28 17:07:31 发布

阅读量304

点赞数

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/QbitAI/article/details/134098387

版权

衡宇萧箫发自凹非寺
量子位 | 公众号 QbitAI

国产大模型估值最高创企，为何是智谱AI？

仅用4个月时间，这家公司就甩出最新成绩证明了自己——

自研大模型ChatGLM3，不止是底层架构，就连模型功能都进行了全方位大升级。

性能上，最直观的表现就是“疯狂屠榜”，所有50个大模型公开性能测评数据集中，拿下44个全国第一；

产品上，率先搞定了用户关注度MAX的代码解释器功能，能生成甚至直接跑通代码！

现在这个新功能已经人人可玩，我们也试着用它给大伙儿比了个心

值得一提的是，这个功能也是国内首家。

所以，从智谱AI发布的ChatGLM3中，究竟能深挖出什么最新的技术细节？

行业又能否从中嗅出什么大模型新动向？

我们从智谱AI的ChatGLM3发布会中一探究竟。

ChatGLM3长啥样？

稍早之前，量子位就获悉了智谱AI将发布迭代后基座模型的消息，取名ChatGLM3。

发布会上，升级后的ChatGLM第三代正式对外披露，主要在4个方面秀出亮点，对比上一代有不小提升。

首先是性能的提升。

据介绍，结合此前ChatGLM系列模型的开发经验，智谱AI采用了独创的多阶段增强与训练方法，同时丰富了训练数据，优化了训练方法，使训练更为充分。

评测结果显示，与ChatGLM2系列模型相比，ChatGLM3一出，性能屠榜：

同尺寸模型中，ChatGLM3拿下了44个中英文公开数据集测试国内第一。

其次是推理能力方面，更为高效，成本也更低。

官方介绍，ChatGLM3系列模型采用了最新的高效动态推理和显存优化技术。

相同硬件、模型条件下，当前的推理框架相较于目前的最佳开源实现——UC伯克利分校提出的vLLM以及Hugging Face TGI的最新版本，推理速度提升了2-3倍。

同时成本降低一倍。目前ChatGLM3系列模型的推理成本，每千tokens仅需要0.5分。

以及ChatGLM3还具备了全新的Agent智能体能力。

智谱AI介绍说，本次迭代后的ChatGLM3集成了自研的AgentTuning技术，激活了模型智能代理能力。

由此也使得ChatGLM3作为国产大模型，能够原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。