替代Manus的“AutoGLM沉思”到底怎么样,实测体验!

AutoGLM 是智谱 AI 在 2025 年 3 月 31 日发布的全球首个“边想边干”AI 智能体,标志着 AI 从被动应答工具向自主执行任务的智能伙伴的跨越。目标一看就是对着 Manus 去的。以下是其官方描述的核心特点:

1. 核心能力

深度研究 + 实时操作:能自主规划任务、调用浏览器访问网页(如京东、知乎),完成数据检索、分析及报告生成等复杂流程。

跨领域泛化:覆盖学术研究、电商比价、旅行规划、金融分析等场景,例如生成行业研报或儿童编程教程。

多模态交互:支持文本、图像混合处理,并模拟人类操作 GUI(如点击、输入)。

2. 技术架构

全栈自研模型:基于 GLM-4-Air-0414(320 亿参数)基座模型,结合推理模型 GLM-Z1-Air(速度比 DeepSeek-R1 快 8 倍,成本仅 1/30)。

动态闭环系统:通过“感知-决策-执行”流程实现任务闭环,例如自动登录网站、整理用户评价并输出报告。

3. 用户体验

免费开放:目前通过智谱清言客户端或浏览器插件免费使用。

执行效率:复杂任务(如生成万字研报)需 5-30 分钟,但支持超长步骤(如 54 步无中断操作)。

4. 局限性

响应延迟:深度分析任务耗时较长。

数据依赖:部分专业领域(如医药)依赖大众平台数据,权威性待提升。

那么是否有这么强,随便找个场景测试一下,是骡子是马拉出来溜溜。

测试一:使用客户端进行操作

Image

Image

Image

Image

Image

Image

结果:只是输出了内容,并没有任何操作,也没有单独打开浏览器等操作。未完成目标。

测试二:使用AutoGLM的Chrome浏览器插件操作

Image

Image

Image

结果:打开了浏览器等,但是最终没有完成任务,它自己直接结束了。

测试三:再使用客户端进行操作

Image

Image

Image

Image

Image

Image

Image

Image

Image

Image

Image

Image

Image

Image

Image

Image

Image

结果:经过漫长的处理,也打开了浏览器,也进行了各个网站的学习,但是最终没有任务,只是输出了课件的设计内容。

结论

实测结果:

  • 客户端测试:仅输出内容,未实际执行操作(如打开浏览器或完成目标任务)。
  • 浏览器插件测试:能启动浏览器但中途终止,未完成任务。
  • 复杂任务测试:虽能访问网站并学习内容,但最终仅生成课件设计,未实现预设的自动化流程

主要是客户端的工具基本都没调用,最终产出有限,可能是测试方法问题,也可能是function_call的问题,期待智谱的进一步产品迭代,出现更智能的智能体!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值