AutoGLM 是智谱 AI 在 2025 年 3 月 31 日发布的全球首个“边想边干”AI 智能体,标志着 AI 从被动应答工具向自主执行任务的智能伙伴的跨越。目标一看就是对着 Manus 去的。以下是其官方描述的核心特点:
1. 核心能力
深度研究 + 实时操作:能自主规划任务、调用浏览器访问网页(如京东、知乎),完成数据检索、分析及报告生成等复杂流程。
跨领域泛化:覆盖学术研究、电商比价、旅行规划、金融分析等场景,例如生成行业研报或儿童编程教程。
多模态交互:支持文本、图像混合处理,并模拟人类操作 GUI(如点击、输入)。
2. 技术架构
全栈自研模型:基于 GLM-4-Air-0414(320 亿参数)基座模型,结合推理模型 GLM-Z1-Air(速度比 DeepSeek-R1 快 8 倍,成本仅 1/30)。
动态闭环系统:通过“感知-决策-执行”流程实现任务闭环,例如自动登录网站、整理用户评价并输出报告。
3. 用户体验
免费开放:目前通过智谱清言客户端或浏览器插件免费使用。
执行效率:复杂任务(如生成万字研报)需 5-30 分钟,但支持超长步骤(如 54 步无中断操作)。
4. 局限性
响应延迟:深度分析任务耗时较长。
数据依赖:部分专业领域(如医药)依赖大众平台数据,权威性待提升。
那么是否有这么强,随便找个场景测试一下,是骡子是马拉出来溜溜。
测试一:使用客户端进行操作
结果:只是输出了内容,并没有任何操作,也没有单独打开浏览器等操作。未完成目标。
测试二:使用AutoGLM的Chrome浏览器插件操作
结果:打开了浏览器等,但是最终没有完成任务,它自己直接结束了。
测试三:再使用客户端进行操作
结果:经过漫长的处理,也打开了浏览器,也进行了各个网站的学习,但是最终没有任务,只是输出了课件的设计内容。
结论
实测结果:
- 客户端测试:仅输出内容,未实际执行操作(如打开浏览器或完成目标任务)。
- 浏览器插件测试:能启动浏览器但中途终止,未完成任务。
- 复杂任务测试:虽能访问网站并学习内容,但最终仅生成课件设计,未实现预设的自动化流程
主要是客户端的工具基本都没调用,最终产出有限,可能是测试方法问题,也可能是function_call的问题,期待智谱的进一步产品迭代,出现更智能的智能体!