Stagehand 是一个由 Browserbase 团队维护的人工智能驱动的网页浏览框架,它是 Playwright 的后继者,提供了三个简单的 API(act、extract 和 observe),这些 API 提供了构建自然语言驱动的网页自动化操作的基础。
Stagehand 的目标是提供一个轻量级、可配置的框架,没有过于复杂的抽象,同时模块化地支持不同的模型和模型提供商。它不会帮你订披萨,但会帮助你可靠地自动化网页操作。
每个 Stagehand 函数接受一个原子指令,例如 act("点击登录按钮") 或 extract("找到红色的鞋子"),生成相应的 Playwright 代码来完成该指令,并执行它。
开始使用
- 安装 Stagehand 包
bash
npm install @browserbasehq/stagehand zod
- 配置你的模型提供商 你需要提供你想要使用的模型提供商的 API 密钥。默认的模型提供商是 OpenAI,你也可以使用 Anthropic 或其他提供商。更多支持的模型信息可以在 API 参考中找到。
bash
export OPENAI_API_KEY=sk-... export ANTHROPIC_API_KEY=sk-...
- 创建 Stagehand 实例 如果你计划在本地运行浏览器,你还需要安装 Pla