OS-Genesis:基于逆向任务合成的 GUI 代理轨迹自动化生成

引言

近年来,图形用户界面GUI)代理(GUI Agents) 在软件自动化、辅助测试和 AI 驱动的任务执行中扮演着越来越重要的角色。然而,当前的 GUI 代理训练仍然面临 高质量数据稀缺 的核心挑战。现有的方法主要依赖:

  • 人工标注数据:人工设计任务,并手动记录交互数据,成本高昂,且扩展性差。

  • 基于预定义任务的合成数据:预设 GUI 任务,并利用规则或模型生成轨迹数据,但存在数据多样性不足、泛化性差的问题。

核心问题

  1. 如何高效构建高质量的 GUI 代理训练数据

  2. 如何减少对人工标注和任务预定义的依赖?

  3. 如何提高 GUI 代理在复杂交互任务中的泛化能力?

OS-Genesis 的贡献

OS-Genesis 提出了一种无监督的 GUI 轨迹数据自动合成框架,其核心思想是:

  • 让代理在 GUI 环境中 主动探索,收集交互数据;

  • 通过 逆向任务合成(RTS 推导任务轨迹,而非依赖人工任务定义;

  • 通过 轨迹奖励模型(TRM) 评估并优化数据质量;

  • 实验表明,OS-Genesis 大幅提升了 GUI

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值