智谱 - AutoGLM

介绍

AutoGLM:接收文字/语音指令,模拟人类操作手机。比如:
(1)微信上给xx的朋友圈点赞并评论
(2)在12306上购买火车票
项目地址:https://xiao9905.github.io/AutoGLM

技术

1、基础智能体 解耦合 中间界面

一步变两步(规划器 + 执行器):解决 动作执行 不够精确的问题
在这里插入图片描述

2、自进化 在线课程 强化学习框架

以web浏览器作为实验环境、引入自进化学习策略,模型不断 自我考察、鞭策、提升。
通过 课程强化学习方法, 该框架根据 智能体当前迭代轮次的能力水平, 动态调整学习的任务难度,以最大程度利用模型潜能。

通过KL散度控制的策略更新以及智能体 置信度经验回放, 减轻迭代训练中 出现模型遗忘先前学习任务的问题。

训练得到开源版 GLM-4-9B, 在WebArena-Lite 评测基准,达到总体43%的 任务成功率。

AndroidLab评测基准上,36.2% 的 success rate

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值