
UFO:Windows操作系统的具象智能代理
UFO作为一个多代理框架,主要包含以下几个组件:HostAgent 🤖:负责选择适合用户请求的应用程序。当请求跨越多个应用时,它还可以在完成部分任务后切换应用。AppAgent 👾:在选定的应用程序内迭代执行操作,直至任务成功完成。应用自动化器 🎮:负责将HostAgent和AppAgent的行动翻译为与应用程序的交互,包括UI控件、原生API或AI工具的使用。这两个代理利用GPT-Vision的多模态能力来理解应用界面并完成用户的请求。更详细的技术内容可以参考官方的技术报告和文档。




















