Cua 项目使用教程
1. 项目介绍
Cua(发音为“koo-ah”,是 Computer-Use Agent 的简称)是一个开源框架,它结合了高性能虚拟化和AI代理能力,为AI系统与桌面应用程序的交互提供了一个安全、隔离的环境。
Cua的主要特性包括:
- 高性能虚拟化:在Apple Silicon上创建和运行macOS/Linux虚拟机,提供接近原生性能(最高可达90%)。
- 计算机使用接口与代理:一个允许AI系统观察和控制虚拟环境的框架,可以与应用程序交互、上网、编写代码以及执行复杂工作流。
2. 项目快速启动
虚拟化能力快速启动(Lume CLI)
如果您只需要虚拟化功能,可以按照以下步骤操作:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/trycua/cua/main/libs/lume/scripts/install.sh)"
有关Lume的使用说明,请参考Lume文档。
完整的计算机使用代理能力快速启动
如果您想使用AI代理和虚拟化环境,请按照以下步骤操作:
- 安装Lume CLI:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/trycua/cua/main/libs/lume/scripts/install.sh)"
- 安装Python库:
pip install cua-computer cua-agent[all]
- 在Python代码中使用库:
from cua.computer import Computer
from cua.agent import ComputerAgent, AgentLoop, LLM, LLMProvider
async with Computer(verbosity=logging.DEBUG) as macos_computer:
agent = ComputerAgent(
computer=macos_computer,
loop=AgentLoop.OPENAI,
# 或者 AgentLoop.ANTHROPIC, 或者 AgentLoop.OMNI
model=LLM(provider=LLMProvider.OPENAI)
# 或者 LLM(provider=LLMProvider.ANTHROPIC)
)
tasks = [
"查找名为 trycua/cua 的GitHub仓库。",
]
for task in tasks:
async for result in agent.run(task):
print(result)
探索Agent Notebook
以获取一个立即可运行的示例。
3. 应用案例和最佳实践
- AI-Gradio:多应用工作流,需要浏览器、VS Code和终端访问。
- Notebook:在Cursor中修复GitHub问题的示例。
4. 典型生态项目
- Lume:用于运行macOS/Linux VMs的CLI,具有接近原生的性能。
- Computer:计算机使用接口(CUI)框架,用于与macOS/Linux沙盒交互。
- Agent:计算机使用代理(CUA)框架,用于在macOS/Linux专用沙盒中运行代理工作流。
- Core:其他Cua包使用的核心功能和实用工具。
- PyLume:Lume的Python绑定。
- Computer Server:计算机使用接口(CUI)框架的服务器组件。
- SOM:代理使用的Self-of-Mark库。
以上就是Cua项目的使用教程,希望对您有所帮助。