这篇论文是24年3月提交的,提出了一个用于agent开发的全流程工具包。
作者提到目前agent开发主要有两个阻碍,一个是缺乏软件基础,另一个是缺乏在真实世界场景中进行评估。针对这两个阻碍,作者涉及了一个开发工具包,包括环境设置、数据收集、agent评估等,并且观察空间和动作空间是高度通用的,并不是针对于某个特定任务。
这里是AgentStudio和传统环境的对比,传统环境基本都是任务特定的,比如基于web的会提供HTML或可访问性树这样的观察,同时动作也是切换标签页这样与任务高度相关的。但是AgentStudio提供的观察就是屏幕截图、录屏以及代码返回结果,动作空间是鼠标键盘操作以及代码操作。这些动作和观察可以在各种任务中通用。