❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!
🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦
🚀 「打工人速救!这个AI神器让浏览器自动干活:爬数据/抢优惠全托管,本地运行更安全」
大家好,我是蚝油菜花。你是否经历过——
- 👉 深夜盯屏幕手动抓数据,复制粘贴到手抽筋
- 👉 秒杀活动总是慢半拍,眼睁睁看库存归零
- 👉 担心自动化工具泄露账号密码,云服务暗藏风险…
今天要拆解的 Nanobrowser ,彻底颠覆传统网页操作方式!这个由多AI智能体驱动的开源神器,能像真人一样:
- ✅ 自动执行:信息收集、比价下单等复杂流程全托管
- ✅ 智能纠错:遇到验证码/页面变动自动调整策略
- ✅ 绝对隐私:数据100%本地处理,告别云端泄露风险
已有运营人用它自动生成竞品报告,程序员靠它抓取GitHub趋势项目——你的浏览器该升级 「自动驾驶」 模式了!
🚀 快速阅读
Nanobrowser 是一款开源的 Chrome 扩展工具,专注于 AI 驱动的网页自动化。
- 核心功能:基于多智能体系统,支持任务自动化、多 LLM 集成和交互式侧边栏。
- 技术原理:通过 Planner、Navigator 和 Validator 三个智能体协作,动态调整任务策略,确保任务成功完成。
Nanobrowser 是什么
Nanobrowser 是一款开源的 Chrome 扩展工具,专注于 AI 驱动的网页自动化。它基于多智能体系统实现复杂的网页任务,如信息提取、自动化操作等。用户可以使用自己的 LLM API 密钥,灵活选择不同的模型为不同智能体提供支持。
Nanobrowser 完全免费,作为 OpenAI Operator 的开源替代方案,支持在本地浏览器运行,注重隐私保护,不涉及云服务。它让 AI 在浏览器中变得更加智能高效,适用于信息收集、电商购物、内容创作等多种场景。
Nanobrowser 的主要功能
- 多智能体系统:
- Planner(规划器):负责制定和调整任务策略。
- Navigator(导航器):执行网页导航和操作。
- Validator(验证器):检查任务是否成功完成。
- 交互式侧边栏:提供直观的聊天界面,实时显示任务状态,用户用自然语言与智能体交互。
- 任务自动化:自动化重复性网页任务,如信息提取、数据整理等,节省时间和精力。
- 多 LLM 支持:支持连接多种大型语言模型(LLM)提供商,用户根据需求为不同智能体选择不同的模型。
Nanobrowser 的技术原理
- 基于 LLM 的智能体架构:Nanobrowser 的核心是多智能体系统,每个智能体由大型语言模型(LLM)驱动。智能体分工协作,高效完成复杂任务:
- 规划器 Planner :制定和完善任务策略。
- 导航器 Navigator :浏览网站并执行操作。
- 验证器 Validator :确认任务结果,检查任务是否成功完成。
- 动态任务调整与自适应性:当遇到障碍或任务失败时,Planner 智能体自动调整策略,重新规划任务路径,确保任务能够成功完成。
- 集成多种 LLM 提供商:支持连接 OpenAI、Anthropic 等主流 LLM 提供商,用户根据需求选择不同的模型,为不同智能体分配最适合的模型。
如何运行 Nanobrowser
快速开始!
1. 下载
- 从官方 GitHub 下载最新的
nanobrowser.zip
文件。 - 发布页面:https://github.com/nanobrowser/nanobrowser/releases
2. 安装
- 解压
nanobrowser.zip
。 - 在 Chrome 中打开
chrome://extensions/
。
在页面右上角启用开发者模式
。 - 开启后,点击页面左上角的
加载已解压的扩展程序
按钮。 - 选择解压后的
nanobrowser
文件夹。
3. 配置智能体模型
- 点击工具栏中的 Nanobrowser 图标,打开侧边栏。
- 点击
设置
图标(右上角)。 - 添加你的 LLM API 密钥。
- 为不同智能体(Navigator、Planner、Validator)选择使用的模型。
从源代码构建项目
1. 前置条件
-
安装
Node.js
(版本 22.12.0 或更高)。 -
安装
pnpm
(版本 9.15.1 或更高)。 -
Node.js 下载链接:https://nodejs.org/
-
pnpm 安装指南:https://pnpm.io/installation
2. 克隆代码库
git clone https://github.com/nanobrowser/nanobrowser.git
cd nanobrowser
3. 安装依赖
pnpm install
4. 构建扩展
pnpm build
5. 加载扩展
- 构建完成的扩展将位于
dist
目录。 - 按照快速入门部分的步骤将扩展加载到浏览器中。
6. 开发模式(可选)
pnpm dev
Nanobrowser 的未来规划
Nanobrowser 的开发团队正在积极开发新功能,以下是一些即将推出的功能:
- 扩展 LLM 支持:集成更多大语言模型提供商。
- 安全防火墙:实施保护措施以确保安全的浏览操作。
- 内存优化:减少令牌使用,同时保持上下文感知。
- 会话回放:高效回放历史任务,同时减少令牌消耗。
- 专用代理:开发针对复杂领域任务的专用代理。
资源
❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!
🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦