Nanobrowser 使用教程
1. 项目介绍
Nanobrowser 是一个开源的 AI 网页自动化工具,它可以在您的浏览器中运行。作为一个免费的 OpenAI Operator 替代方案,Nanobrowser 提供了灵活的语言模型(LLM)选项和多人代理系统。
Nanobrowser 的特点如下:
- 完全免费:无需订阅费用或隐藏成本,只需安装并使用自己的 API 密钥,您只需为自己使用的 API 密钥付费。
- 隐私保护:所有操作都在本地浏览器中进行,您的凭证始终与您同在,不会与任何云服务共享。
- 灵活的 LLM 选项:连接到您偏好的 LLM 提供商,自由选择为不同的代理使用不同的模型。
- 完全开源:透明地了解您的浏览器是如何自动化的,没有黑盒或隐藏的流程。
2. 项目快速启动
安装
-
从 Chrome Web Store 安装 Nanobrowser(稳定版):
- 访问 Nanobrowser 的 Chrome Web Store 页面
- 点击“添加到 Chrome”按钮
- 在提示时确认安装
-
配置代理模型:
- 点击工具栏中的 Nanobrowser 图标打开侧边栏
- 点击设置图标(右上角)
- 添加您的 LLM API 密钥
- 为不同的代理(导航器、策划者、验证器)选择要使用的模型
手动安装最新版本
- 下载最新版本的 nanobrowser.zip 文件。
- 解压缩 nanobrowser.zip 文件。
- 在 Chrome 中打开
chrome://extensions/
。 - 启用开发者模式(右上角)。
- 点击“加载已解压的扩展程序”(左上角)。
- 选择解压缩的 nanobrowser 文件夹。
3. 应用案例和最佳实践
以下是一些使用 Nanobrowser 的案例和最佳实践:
多代理系统
Nanobrowser 的多代理系统能够让专门的 AI 代理合作完成复杂的网页工作流程。例如,您可以设置一个策划者代理来规划任务,导航器代理来执行网页操作,验证器代理来检查任务结果。
任务自动化
利用 Nanobrowser 的任务自动化功能,您可以轻松自动化重复性的网页任务,比如数据抓取、表单填写等。
实时交互侧边栏
Nanobrowser 提供了一个实时的交互侧边栏,您可以通过它与 AI 代理进行交流,并获取实时状态更新。
4. 典型生态项目
在开源社区中,Nanobrowser 可以与其他工具和项目集成,以下是一些典型的生态项目:
- OpenAI: 连接 OpenAI 的 API,使用其强大的语言模型。
- Anthropic: 使用 Anthropic 提供的 LLM 模型。
- Gemini: 探索与 Gemini 模型的集成,为复杂任务提供支持。
通过这些典型的生态项目,您可以扩展 Nanobrowser 的功能,实现更复杂的自动化任务。