Stagehand 使用指南
1. 项目介绍
Stagehand 是一个基于人工智能的网页自动化框架,它致力于简单性和可扩展性。Stagehand 完全兼容 Playwright,在 Playwright 的 Page 类之上提供了三个简单的 AI API(act、extract 和 observe),这些 API 为通过自然语言进行网页自动化提供了构建块。
Stagehand 通过为原本不可预测的代理添加确定性来提升功能。用户可以控制将多少操作留给 AI 处理,最佳的使用方式是将代码编写为一系列原子操作。Stagehand 允许用户编写耐用、自我修复且可重复的网页自动化工作流程。
2. 项目快速启动
首先,确保您的系统中已经安装了 Node.js。然后,按照以下步骤进行操作:
# 克隆项目
git clone https://github.com/browserbase/stagehand.git
cd stagehand
# 安装依赖
npm install
npx playwright install
# 构建项目
npm run build
# 运行示例脚本
npm run example
在运行示例脚本之前,您可能需要配置环境变量。复制 .env.example
文件为 .env
,然后在 .env
文件中添加您的 API 密钥和 Browserbase 凭据。
cp .env.example .env
nano .env
3. 应用案例和最佳实践
以下是一个简单的 Stagehand 脚本示例,它演示了如何使用 Stagehand API:
// 引入必要的模块
import { Page } from 'playwright';
import { act } from '@browserbasehq/stagehand';
// 创建一个新的 Playwright 页面实例
const page = await browser.newPage();
// 访问 Stagehand 文档页面
await page.goto('https://docs.stagehand.dev');
// 使用 Stagehand 的 act API 点击 "Quickstart" 链接
await act(page, 'click on the "Quickstart"');
在实际应用中,您应该将代码编写为一系列原子动作,以便 Stagehand 能够有效地执行您的自动化任务。
4. 典型生态项目
Stagehand 的生态系统包括了多个与之协同工作的项目,以下是一些典型的生态项目:
- Playwright: Stagehand 依赖于 Playwright 来执行网页自动化任务。
- Langchain: 用于集成不同的语言模型,以提供更强大的自然语言处理能力。
- Claude MCP: 一个开源的聊天机器人平台,可以与 Stagehand 集成。
通过结合这些生态项目,您可以扩展 Stagehand 的功能,实现更复杂的自动化任务。