1 月 23 日,智谱宣布旗下电脑智能体 GLM-PC 开放体验124。以下是关于 GLM-PC 的详细介绍1:
技术基础
GLM-PC 基于智谱多模态大模型 CogAgent,是全球首个面向公众、回车即用的电脑智能体。
功能特点
- “左右脑” 分工协作
- “左脑”:负责代码生成与逻辑执行,具有规划、循环执行、长思考能力(动态反思、纠错与优化)等功能。能够根据任务需求,综合分析目标与可用资源,生成执行路线图,将大型任务分解为可管理的子任务。
- “右脑”:负责图像与 GUI 认知,专注于深度感知与交互体验,支持 GUI 图像理解、用户行为认知、图像语义解析等功能。能准确识别图形界面中的元素,如按钮和图标,并结合用户的历史操作信息提供智能推荐,还可以融合图像与文字信息,为用户提供全面的感知结果。
- 具体功能应用
- 数据处理与存储:能自动提取图片中的商品数据并存储至 Excel,还可将商品加入淘宝购物车。能快速查找并提取小红书上的电影等信息,撰写代码将信息存储在电脑上,若代码出错可自我修正,还能引用图文贴的图片发送至微信群聊。
- 文档处理:可从指定网站中自动提取六级词汇,进行造句,并将词汇及其造句自动保存至新建 Word 文档并命名。能将小红书帖子文字内容保存至指定 Word 文档,将公司信息存储至桌面新建的 Excel 文件。
- 生活服务:可自动为微信群好友定制个性化新春祝福语及祝贺图片 / 视频,并一键群发。还能快速查询航班信息,筛选最经济机票,并同步设置飞书日历提醒。
此前发展
GLM-PC v1.0 于 2024 年 11 月 29 日发布并开放内测,当时新增了 “深度思考” 模式,强化了逻辑推理和代码生成功能,同时支持 Windows 系统。
意义价值
GLM-PC 的推出为用户带来了更高效、智能的电脑使用体验,标志着人机交互的一个重要进步,有望在办公、学习等诸多领域发挥重要作用,推动人工智能在电脑操作自动化领域的进步。