[阅读笔记29][AgentStudio]A Toolkit for Building General Virtual Agents

CCloth

已于 2024-04-20 21:04:38 修改

阅读量453

点赞数 3

文章标签：笔记

于 2024-04-20 20:51:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_55982600/article/details/138011144

版权

这篇论文是24年3月提交的，提出了一个用于agent开发的全流程工具包。

作者提到目前agent开发主要有两个阻碍，一个是缺乏软件基础，另一个是缺乏在真实世界场景中进行评估。针对这两个阻碍，作者涉及了一个开发工具包，包括环境设置、数据收集、agent评估等，并且观察空间和动作空间是高度通用的，并不是针对于某个特定任务。

这里是AgentStudio和传统环境的对比，传统环境基本都是任务特定的，比如基于web的会提供HTML或可访问性树这样的观察，同时动作也是切换标签页这样与任务高度相关的。但是AgentStudio提供的观察就是屏幕截图、录屏以及代码返回结果，动作空间是鼠标键盘操作以及代码操作。这些动作和观察可以在各种任务中通用。

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

CCloth CSDN认证博客专家 CSDN认证企业博客

码龄4年

410: 原创

18万+: 周排名

8万+: 总排名

17万+: 访问

: 等级

4594: 积分

327: 粉丝

471: 获赞

53: 评论

602: 收藏

私信

关注

热门文章

分类专栏

最新评论

[阅读笔记23][JAM]JOINTLY TRAINING LARGE AUTOREGRESSIVE MULTIMODAL MODELS
ha_lydms: 这个博客的排版和设计都非常专业，让阅读变得更加愉快。
[阅读笔记10][instructBLIP]Towards General-purpose Vision-Language Models with Instruction Tuning
普通网友: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
[阅读笔记18][CITING]LARGE LANGUAGE MODELS CREATE CURRICULUM FOR INSTRUCTION TUNING
程序小勇: 哈哈哈，已经三连，望互关互粉，谢谢！向大哥学习，请多多指教！博主优质好文，技术分享到位，由浅入深，循序渐进，有深度，也不失广度.愿我们IT技术蓬勃发展，再创辉煌佳绩，相信有一天我们的技术也可以走向世界，改变世界。
[贪心][二分]Occupy the Cities 2021CCPC桂林站G
CCloth: 要先把已经确定方向的1扩展完，所以是在11001000的基础上判断第二个1往哪边扩
[贪心][二分]Occupy the Cities 2021CCPC桂林站G
LETTER•: 贪心对10001000是不是有问题，第二个1向左侧不能让时间最小

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。