春节前,智谱AI先给开发者过了个小年。
2024年1月16日,中国模型层独角兽智谱AI举办了首届AI技术开放日Dev Day。自2023年10月语言大模型ChatGLM3发布以来,智谱AI在3个月的时间里,将基座模型GLM的能力提升了60%。
随着模型能力的提升、AI应用生态的建立,模型层厂商建立OS(操作系统)也水到渠成。智谱AI CEO张鹏对36氪直言,做OS不叫野心,“而是模型能力达到一定水平后自然而然要做的事”。
围绕迭代模型、建立AI应用生态、构建AI OS,智谱AI的Dev Day的发布有三个重点:
- 最新大模型基座发布,中文环境下各项能力几乎超过GPT-4,英文环境下各项能力均达到GPT-4的90%;
- 发布定制化模型生成工具,实现0代码分钟级创建基础AI应用。与此同时,GLMs模型应用商店上线;
- 推出多模型能力自动调用工具。All Tools可以被视作AI OS的一个雏形,能根据用户的指令对GLMs进行自动选取、调用、执行。
对不少开发者而言,这些更新听上去并不陌生。2023年11月16日,OpenAI就在Dev Day推出了定制化模型生成工具GPTs和应用商店,也被视作构建AI OS的标志。
对智谱AI而言,OpenAI是最强的对手,也是技术能力的试金石。对标OpenAI,智谱AI建立了从通用模型基座到多模态模型的产品线。
智谱AI对标OpenAI建立的产品线
摸着OpenAI过河,张鹏认为,GLM-4的能力已经接近GPT-4,够到了建AI应用生态、做AI OS的门槛。他也预言,下一次模型能力的跃升,将出现在具身智能的突破。
单次处理300页小说,模型能力达GPT-4九成
在模型能力上,OpenAI是智谱AI一直追赶的对手。
Dev Day上最新发布的GLM-4,目前在英文基础能力的表现上,已经能和GPT-4掰掰手腕,均达到了对手能力的九成;在中文能力的表现上,除了逻辑推理和中文推理两项能力不及GPT-4,其他维度已经超越了对方。
而在指令跟随能力这一维度上,GLM-4还有一定的提升空间。所谓的指令跟随能力,就是模型解读输入Prompt和指令的能力,是理解用户意图的重要维度。在英文Prompt的理解上,GLM-4能力相较于GPT-4稍弱,为后者的85%。
图源:智谱AI
随着模型发展阶段从狂卷参数规模,到应用落地,如今,通过扩展上下文窗口来提升模型的“记忆力”,成为不少厂商发力的方向。
GLM-4也不例外,它将上下文窗口从32K扩展到了128K,这意味着单次可以处理约20万字的文本,相当于300页的小说。
当然,能处理的文本越长,模型也越容易“失忆”。据智谱AI介绍,GLM-4目前可以做到对记忆几乎100%的精准召回。
在作者上传一整本马伯庸的9万字小说《长安的荔枝》后,可以看到,GLM-4不仅准确得出李善德运送荔枝的天数,总结了他成功保存荔枝的方法,还定位了刺杀李善德的真凶。