Agent-S项目安装与配置指南
1. 项目基础介绍
Agent-S是一个开源的框架,旨在通过Agent-Computer Interface实现与计算机的自主交互。它旨在构建能够从过去经验中学习并能在计算机上自主执行复杂任务的智能GUI代理。该项目适用于对AI、自动化或贡献于最前沿的基于代理的系统感兴趣的用户。
主要编程语言:Python
2. 项目使用的关键技术和框架
- Agent-Computer Interface: 实现计算机自主交互的接口。
- UI-TARS: 作为接地模型(grounding model),用于更好地理解和交互用户界面。
- Perplexica API: 集成了搜索引擎功能,以提供更便捷和响应迅速的用户体验。
- Docker: 用于部署和运行环境。
- Python GUI库: 如
pyautogui
,用于控制计算机界面。
3. 项目安装和配置的准备工作
在开始安装之前,请确保以下准备工作已经完成:
- 安装Docker Desktop并确保其正在运行。
- 准备Python环境,确保pip已经安装。
- 如果在Linux系统上,不要使用conda环境进行安装,因为它会与pyatspi冲突。
详细安装步骤
以下为详细的安装步骤:
克隆仓库
首先,需要克隆项目仓库到本地:
git clone https://github.com/simular-ai/Agent-S.git
安装依赖
使用pip安装项目所需的gui-agents包:
pip install gui-agents
设置环境变量
将以下行添加到你的.bashrc
(Linux)或.zshrc
(MacOS)文件中,以设置LLM API密钥和其他环境变量:
export OPENAI_API_KEY=<你的API密钥>
export ANTHROPIC_API_KEY=<你的API密钥>
export HF_TOKEN=<你的HF令牌>
或者在Python脚本中设置环境变量:
import os
os.environ["OPENAI_API_KEY"] = "<你的API密钥>"
配置Perplexica
为了使Agent S能够使用网络知识检索,需要配置Perplexica:
- 确保Docker Desktop安装并正在运行。
- 导航到项目文件所在的目录。
cd Perplexica
git submodule update --init
-
将
sample.config.toml
文件重命名为config.toml
,并填写所需的API密钥信息。 -
在包含
docker-compose.yaml
文件的目录中执行以下命令启动Perplexica服务:
docker compose up -d
使用Agent S
启动Agent S2并指定模型(默认为gpt-4o
):
agent_s2 --model claude-3-7-sonnet-20250219 --grounding_model claude-3-7-sonnet-20250219
或者使用自定义端点:
agent_s2 --model claude-3-7-sonnet-20250219 --endpoint_provider "huggingface" --endpoint_url "<endpoint_url>/v1/"
遵循以上步骤,您应该能够成功安装和配置Agent-S项目。