文章目录
从 AI 编程助手到 AI Agent 应用实战
1 AI Agent是什么?和AI编程如何协同?
AI Agent是什么?
- AI Agent 是能够感知环境、进行独立决策和调用工具完成给定目标的智能实体。
- 感知端(Perception):支持多模态输入(文本、视觉、听觉、其他等)
- 控制端(Brain):LLMs 推理和规划能力(依赖知识和记忆)
- 行动端(Action):完成执行动作(文本输出、工具使用、具身行动)
AI Agent 案例
当人类询问是否会下雨时?
- 感知端(Perception):将指令转换为 LLMs 可以理解的表示
- 控制端(Brain):开始根据当前天气和互联网上的天气预报进行推理和行动规划
- 行动端(Action):做出响应并将雨伞递给人类
AI Agent 三种范式
- 单代理
- 多代理
- 人机交互
AI Agent 和 AI 编程如何协同?
- AI 编程是 AI Agent 技术架构落地的一种高效实现方式
- AI Agent 是 AI 应用(AI 程序)
2 AGI/LLM/Lightweight AI Agent剖析
AGI Agents
- 通用人工智能实体(终态)——MetaGPT
- 输入提示词
- 生成一个团队:产品经理、架构师、项目经理、开发工程师、测试工程师
- 完成产品需求设计、架构设计、代码编写和测试等整一个的过程
- AGI Agents——AutoGPT
- 比如:明年我应该买英伟达股票还是微软股票?
- AGI Agents——LLM Agents