Manus
Manus是一款由中国的创业公司Monica.im(蝴蝶效应科技)开发的通用型AI Agent(人工智能代理)产品,于2025年3月正式发布。它被定位为全球首款能够自主规划、执行并交付复杂任务的AI助手,突破了传统对话式AI的局限,旨在为用户提供从任务规划到结果交付的全流程闭环服务。
1. 核心功能与特点
- 自主执行能力:Manus不仅能理解用户需求,还能独立完成从任务规划到实际操作的全过程。例如,用户只需输入“筛选适合投资的股票”或“制作一份AI产品介绍的PPT”,Manus可以自动调用工具(如Python脚本、浏览器等)完成任务并交付结果。
- 多智能体架构:Manus采用多代理系统,将复杂任务分解为规划、执行和验证三个模块,每个模块由独立的语言模型或强化学习模型支持,通过API协同工作。
- 跨领域应用:Manus已展示出在金融分析、招聘筛选、房地产推荐、编程辅助等多个领域的实用价值。例如,它可以解压简历包并自动筛选候选人,或生成股票分析报告。
2. 技术亮点
- 多智能体分工系统:包括规划代理(采用蒙特卡洛树搜索算法)、执行代理(调用工具完成任务)和验证代理(通过对抗性测试检测逻辑矛盾)。
- 云端虚拟机模式:Manus在云端设置了一个“虚拟机”,用户可以在低性能设备上完成复杂任务,所有操作在云端执行。
- GAIA基准测试表现:Manus在GAIA基准测试中创造了新的SOTA(最先进)记录,性能超越了包括OpenAI在内的同类产品。
Manus的推出标志着AI从“建议者”向“执行者”的转变,为人机协作提供了新的可能性。尽管面临技术质疑和市场炒作,其多智能体架构和全流程闭环能力为通用人工智能(AGI)的落地提供了重要参考。
OpenManus
由于Manus目前还需邀请码才能使用,今天就使用OpenManus尝试一下本地部署。OpenManus 是一个由 MetaGPT 团队开发的开源 AI 助手项目,旨在复刻并扩展 Manus 的功能。 OpenManus 则通过开源方式提供了类似Manus的功能,且无需邀请码即可使用。
OpenManus 提供了以下主要功能:
- Python 代码执行器:支持实时生成和执行代码,完成复杂的计算和自动化任务。
- 文件处理系统:能够生成和管理多种文档格式。
- 网络搜索工具:自动检索网络信息,为任务提供数据支持。
- 浏览器自动化:模拟人类操作,完成网页浏览和交互任务。
此外,OpenManus 还支持实时反馈机制,用户可以直观地看到 AI 的思考过程和任务执行进度。
安装
创建新的 conda 环境
conda create -n open_manus python=3.12
conda activate open_manus
克隆仓库
git clone https://github.com/mannaandpoem/OpenManus.git
cd OpenManus
安装依赖 (用时较长,耐心等待)
pip install -r requirements.txt
配置
OpenManus 需要配置使用的 LLM API,请按以下步骤设置:
在 config
目录创建 config.toml
文件(可从示例复制)
cp config/config.example.toml config/config.toml
编辑 config/config.toml
添加 API 密钥和自定义设置
可以填写本地的模型
# 全局 LLM 配置
[llm]
model = "gpt-4o"
base_url = "https://api.openai.com/v1"
api_key = "sk-..."
max_tokens = 4096
temperature = 0.0
# 可选特定 LLM 模型配置
[llm.vision]
model = "gpt-4o"
base_url = "https://api.openai.com/v1"
api_key = "sk-..."
启动
python main.py
如需体验开发中版本,可运行
python run_flow.py
使用
由于代码使用的搜索引擎是google,使用时会导致搜索失败,可以通过Cursor将代码中的google换成baidu,程序在运行过程的错误也可以让Cursor修正
经过Claude-3.7-sonnet和Claude-3.5的协同配合下,修改了n次,终于可以顺利执行了,我使用的模型是DeepSeek,程序执行过程中会消耗大量token,注意余额,量力而行。
执行速度很慢,最终耗费了30万个token,0.6元和大量的时间还是没完成一个项目,改天继续…😊😊😊