背景
近期,国内团队推出的通用型AI Agent产品Manus因在GAIA基准测试中刷新性能记录引发行业关注,其"手脑协同"能力可完成简历筛选、旅行规划等复杂任务,内测邀请码一度被炒至数万元。但对于开发者而言,依赖商业产品存在技术黑箱与成本限制。值得庆幸的是,Meta GPT团队与Camel团队已分别开源了 OpenManus和OpenManus-OWL ,为开发者提供了自主部署的解决方案。本文将深入解析本地部署的技术路径与替代方案。
今天推荐一个优质开源OpenManus项目:
camel团队的OpenManus-OWL: https://github.com/MaoTouHU/OpenManus-OWL
文章目录
作者简介
猫头虎是谁?
大家好,我是 猫头虎,猫头虎技术团队创始人,也被大家称为猫哥。我目前是COC北京城市开发者社区主理人、COC西安城市开发者社区主理人,以及云原生开发者社区主理人,在多个技术领域如云原生、前端、后端、运维和AI都具备丰富经验。
我的博客内容涵盖广泛,主要分享技术教程、Bug解决方案、开发工具使用方法、前沿科技资讯、产品评测、产品使用体验,以及产品优缺点分析、横向对比、技术沙龙参会体验等。我的分享聚焦于云服务产品评测、AI产品对比、开发板性能测试和技术报告。
目前,我活跃在CSDN、51CTO、腾讯云、阿里云开发者社区、华为云开发者社区、知乎、微信公众号、视频号、抖音、B站、小红书等平台,全网粉丝已超过30万。我所有平台的IP名称统一为猫头虎或猫头虎技术团队。
我希望通过我的分享,帮助大家更好地掌握和使用各种技术产品,提升开发效率与体验。
作者名片 ✍️
- 博主:猫头虎
- 全网搜索关键词:猫头虎
- 作者微信号:Libin9iOak
- 作者公众号:猫头虎技术团队
- 更新日期:2025年03月09日
- 🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能!
加入我们AI共创团队 🌐
- 猫头虎AI共创社群矩阵列表:
加入猫头虎的共创圈,一起探索编程世界的无限可能! 🚀
正文
🏆 OWL 在 GAIA 基准测试中取得58.18平均分,在开源框架中排名🏅️ #1! 🏆
🦉 OWL 是一个前沿的多智能体协作框架,推动任务自动化的框架,构建在CAMEL-AI 框架上。
OWL团队的愿景是彻底变革人工智能智能体协作解决现实任务的方式。通过利用高效动态智能体交互,OWL 实现了跨多领域更自然、健全的任务自动化。
🔥项目日志
- [2025.03.07] : OWL团队开源了 🦉 OWL 项目的代码库。
✨️核心功能
- 在线搜索:利用维基百科、谷歌搜索等,进行实时信息检索
- 多模态处理:支持互联网或本地视频、图片、语音处理
- 浏览器操作:借助Playwright框架开发浏览器模拟交互,支持页面滚动、点击、输入、下载、历史回退等功能
- 文件解析:word、excel、PDF、PowerPoint信息提取,内容转文本/Markdown
- 代码执行:编写python代码,并使用解释器运行
🛠️ 安装
克隆 Github 仓库
git clone https://github.com/camel-ai/owl.git
cd owl
创建环境
使用Conda(推荐):
conda create -n owl python=3.11
conda activate owl
使用 venv(备用):
python -m venv owl_env
# Windows 系统
owl_env\Scripts\activate
# Unix 或 MacOS 系统
source owl_env/bin/activate
安装依赖
python -m pip install -r requirements.txt
设置环境变量
在owl/.env_template
文件中,您可以找到所有需要的API按键以及各服务的注册网址。要使用这些API服务,请按照以下步骤操作:
- 复制并重命名:复制
.env_example
文件,保存副本重命名为.env
。 - 填写您的API键:打开
.env
文件,在相应字段中填入您的API键。 - 使用更多其他模型:请参考OWL团队CAMEL的模型文档:https://docs.camel-ai.org/key_modules/models.html#supported-model-platforms-in-camel
注意:为了获得最佳性能,OWL团队强烈建议使用 OpenAI 模型。OWL团队通过测试发现,其他模型在处理复杂任务和基准测试时可能会导致性能显着降低。
使用Docker运行
如果您希望使用 Docker 运行 OWL 项目,OWL团队提供完整的 Docker 支持:
# 克隆仓库
git clone https://github.com/camel-ai/owl.git
cd owl
# 配置环境变量
cp owl/.env_template owl/.env
# 编辑.env文件,填入您的API密钥
# 构建并运行Docker容器
docker-compose up -d
# 在容器中运行OWL
docker-compose exec owl bash -c "xvfb-python run.py"
更详细的Docker使用说明,包括跨平台支持、优化配置和故障修复,请参阅DOCKER_README.md
🚀 快速开始
运行以下示例:
python owl/run.py
OWL团队还提供了一个最小化的示例,只需配置LLM的API密钥即可运行:
python owl/run_mini.py
使用模型
OWL 支持多种 LLM 运行。您可以使用以下脚本来不同的模型:
# 使用 Qwen 模型运行
python owl/run_qwen.py
# 使用 Deepseek 模型运行
python owl/run_deepseek.py
# 使用其他 OpenAI 兼容模型运行
python owl/run_openai_compatiable_model.py
你可以通过修改run.py
脚本来运行自己的任务:
# Define your own task
question = "Task description here."
society = construct_society(question)
answer, chat_history, token_count = run_society(society)
print(f"Answer: {answer}")
上传文件时,只需提供文件路径和问题:
# 处理本地文件(例如,文件路径为 `tmp/example.docx`)
question = "给定的 DOCX 文件中有什么内容?文件路径如下:tmp/example.docx"
society = construct_society(question)
answer, chat_history, token_count = run_society(society)
print(f"答案:{answer}")
OWL 将自动调用与文档相关的工具来处理文件并提取答案。
您可以尝试以下示例任务:
- “查询苹果公司最新股票价格”
- “分析关于气候变化的最新推文情绪”
- “帮我调试Python代码:[这里粘贴你的代码]”
- “总结本文研究论文的主要观点:[论文URL]”
🧪实验
OWL团队提供了一个脚本用于恢复 GAIA 上的实验结果。
您可以查看run_gaia_roleplaying.py
文件,并运行以下命令:
python run_gaia_roleplaying.py
📄 许可证
来源代码采用 Apache 2.0 许可证。
❓ 常见问题
问:为什么启动脚本脚本后,我没有看到本地运行 Chrome 浏览器?
A:当OWL判断某个任务可以使用非浏览器工具(如搜索、代码分析等)完成时,浏览器就不会启动。只有在判断需要使用浏览器工具的时候,本地才会弹出浏览器窗口,并进行浏览器模拟交互。
粉丝福利
👉 更多信息:有任何疑问或者需要进一步探讨的内容,欢迎点击文末名片获取更多信息。我是猫头虎,期待与您的交流! 🦉💬
联系我与版权声明 📩
- 联系方式:
- 微信: Libin9iOak
- 公众号: 猫头虎技术团队
- 版权声明:
本文为原创文章,版权归作者所有。未经许可,禁止转载。更多内容请访问猫头虎的博客首页。
点击✨⬇️下方名片
⬇️✨,加入猫头虎AI共创社群,交流AI新时代变现的无限可能。一起探索科技的未来,共同成长。🚀