衡宇 萧箫 发自 凹非寺
量子位 | 公众号 QbitAI
国产大模型估值最高创企,为何是智谱AI?
仅用4个月时间,这家公司就甩出最新成绩证明了自己——
自研大模型ChatGLM3,不止是底层架构,就连模型功能都进行了全方位大升级。
性能上,最直观的表现就是“疯狂屠榜”,所有50个大模型公开性能测评数据集中,拿下44个全国第一;
产品上,率先搞定了用户关注度MAX的代码解释器功能,能生成甚至直接跑通代码!
现在这个新功能已经人人可玩,我们也试着用它给大伙儿比了个心
值得一提的是,这个功能也是国内首家。
所以,从智谱AI发布的ChatGLM3中,究竟能深挖出什么最新的技术细节?
行业又能否从中嗅出什么大模型新动向?
我们从智谱AI的ChatGLM3发布会中一探究竟。
ChatGLM3长啥样?
稍早之前,量子位就获悉了智谱AI将发布迭代后基座模型的消息,取名ChatGLM3。
发布会上,升级后的ChatGLM第三代正式对外披露,主要在4个方面秀出亮点,对比上一代有不小提升。
首先是性能的提升。
据介绍,结合此前ChatGLM系列模型的开发经验,智谱AI采用了独创的多阶段增强与训练方法,同时丰富了训练数据,优化了训练方法,使训练更为充分。
评测结果显示,与ChatGLM2系列模型相比,ChatGLM3一出,性能屠榜:
同尺寸模型中,ChatGLM3拿下了44个中英文公开数据集测试国内第一。
其次是推理能力方面,更为高效,成本也更低。
官方介绍,ChatGLM3系列模型采用了最新的高效动态推理和显存优化技术。
相同硬件、模型条件下,当前的推理框架相较于目前的最佳开源实现——UC伯克利分校提出的vLLM以及Hugging Face TGI的最新版本,推理速度提升了2-3倍。
同时成本降低一倍。目前ChatGLM3系列模型的推理成本,每千tokens仅需要0.5分。
以及ChatGLM3还具备了全新的Agent智能体能力。
智谱AI介绍说,本次迭代后的ChatGLM3集成了自研的AgentTuning技术,激活了模型智能代理能力。
由此也使得ChatGLM3作为国产大模型,能够原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。