用智谱AI的类「GPTs」,我做一个Agent只花了30秒

智谱AI发布最新模型GLM-4,其能力接近GPT-4的90%,并推出0代码Agent定制工具GLMs,建立AI应用生态。GLM-4拥有强大的指令跟随能力,可处理长文本,已在多个方面超越GPT-4。此外,GLMs模型应用商店上线,助力构建AI OS。
摘要由CSDN通过智能技术生成

春节前,智谱AI先给开发者过了个小年。

2024年1月16日,中国模型层独角兽智谱AI举办了首届AI技术开放日Dev Day。自2023年10月语言大模型ChatGLM3发布以来,智谱AI在3个月的时间里,将基座模型GLM的能力提升了60%。

随着模型能力的提升、AI应用生态的建立,模型层厂商建立OS(操作系统)也水到渠成。智谱AI CEO张鹏对36氪直言,做OS不叫野心,“而是模型能力达到一定水平后自然而然要做的事”。

围绕迭代模型、建立AI应用生态、构建AI OS,智谱AI的Dev Day的发布有三个重点:

  • 最新大模型基座发布,中文环境下各项能力几乎超过GPT-4,英文环境下各项能力均达到GPT-4的90%;
  • 发布定制化模型生成工具,实现0代码分钟级创建基础AI应用。与此同时,GLMs模型应用商店上线;
  • 推出多模型能力自动调用工具。All Tools可以被视作AI OS的一个雏形,能根据用户的指令对GLMs进行自动选取、调用、执行。

对不少开发者而言,这些更新听上去并不陌生。2023年11月16日,OpenAI就在Dev Day推出了定制化模型生成工具GPTs和应用商店,也被视作构建AI OS的标志。

对智谱AI而言,OpenAI是最强的对手,也是技术能力的试金石。对标OpenAI,智谱AI建立了从通用模型基座到多模态模型的产品线。

智谱AI对标OpenAI建立的产品线

摸着OpenAI过河,张鹏认为,GLM-4的能力已经接近GPT-4,够到了建AI应用生态、做AI OS的门槛。他也预言,下一次模型能力的跃升,将出现在具身智能的突破。

单次处理300页小说,模型能力达GPT-4九成

在模型能力上,OpenAI是智谱AI一直追赶的对手。

Dev Day上最新发布的GLM-4,目前在英文基础能力的表现上,已经能和GPT-4掰掰手腕,均达到了对手能力的九成;在中文能力的表现上,除了逻辑推理和中文推理两项能力不及GPT-4,其他维度已经超越了对方。

而在指令跟随能力这一维度上,GLM-4还有一定的提升空间。所谓的指令跟随能力,就是模型解读输入Prompt和指令的能力,是理解用户意图的重要维度。在英文Prompt的理解上,GLM-4能力相较于GPT-4稍弱,为后者的85%。

图源:智谱AI

随着模型发展阶段从狂卷参数规模,到应用落地,如今,通过扩展上下文窗口来提升模型的“记忆力”,成为不少厂商发力的方向。

GLM-4也不例外,它将上下文窗口从32K扩展到了128K,这意味着单次可以处理约20万字的文本,相当于300页的小说。

当然,能处理的文本越长,模型也越容易“失忆”。据智谱AI介绍,GLM-4目前可以做到对记忆几乎100%的精准召回。

在作者上传一整本马伯庸的9万字小说《长安的荔枝》后,可以看到,GLM-4不仅准确得出李善德运送荔枝的天数,总结了他成功保存荔枝的方法,还定位了刺杀李善德的真凶。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值