大模型书籍丨AI Agent这本书无敌，Agent框架+7个实例助你拿捏Agent！-CSDN博客

本文链接：https://blog.csdn.net/DEVELOPERAA/article/details/142176485

Agent 作为一种新兴的人工智能技术，正在受到越来越多的关注。要说清楚什么是 Agent，先得看看人工智能的本质是什么。

在这里插入图片描述

在人工智能领域中，代理是一种具有计算能力的实体，研究者只能观察到它们的行为和决策过程。为了深入理解和描述这些代理，研究者通常会引入其他几个关键属性，包括自主性、反应性、社会亲和性以及学习能力，以全面地认识人工智能代理的能力和潜力。

■ 感知环境，就是指 Agent 能够接收来自环境的信息。例如，一个自动驾驶 Agent 可以感知周围的交通情况、道路状况等信息。

■ 做出决策，就是指 Agent 根据感知的信息制订下一步的行动计划。例如，自动驾驶 Agent 根据感知的信息决定是否加速、减速、转弯等。

■ 采取行动，就是指 Agent 根据决策执行相应的行动。例如，自动驾驶 Agent 根据决策控制汽车的加速器、刹车、方向盘等。

因此，Agent 能够独立完成特定的任务。Agent 的四大特性如下。

■ 自主性：Agent 能够根据自身的知识和经验，独立做出决策和执行行动。

■适应性：Agent能够学习和适应环境，不断提高自己的能力。

■ 交互性：Agent 能够与人类进行交互，提供信息和服务。

■ 功能性：Agent 可以在特定领域内执行特定的任务。从技术角度来说，Agent 通常包括以下核心组件。

■ 感知器：Agent 通过感知器接收关于环境的信息。这可以是通过传感器收集的实时数据，也可以是通过数据库或互联网获取的信息。

■ 知识库：Agent 根据目标和以往的经验，通过知识库存储和管理有关环境和自身状态的信息。

■ 决策引擎：Agent 分析感知的信息，并结合知识库中的数据，通过决策引擎做出决策。

■ 执行器：Agent 通过执行器在环境中采取行动。这可以是物理动作，如机器人移动其手臂，也可以是虚拟动作，如在线服务发送信息。

尽管构建 Agent 的基石已经准备就绪，但 Agent 的技术发展仍处于萌芽阶段。开发者需要进行深入思考并动手实践，以确立 Agent 的开发框架、Agent 访问工具的方式、与数据交互的方式，以及如何对话以完成具体任务。这些问题的答案将塑造未来 Agent 的形态和能力。

学习 Agent需要这样一本AI Agent书籍

在这里插入图片描述

目前无论是学术界还是产业界，对人工智能应用开发的关键问题远未达成共识。《动手做AI Agent GPT》或许可以作为读者深入探讨上述问题的漫长旅途的开端。本书旨在从技术和工具层面阐释 Agent 设计的框架、功能和方法，具体涉及如下技术或工具。

除了介绍 Agent 的框架和开发工具之外，本书还将通过 7 个实操项目，带领读者学习前沿的 Agent 实现技术。这 7 个项目分别如下。

Agent 1：自动化办公的实现——通过 Assistants API 和 DALL ·E 3 模型创作 PPT。

■ Agent 2：多功能选择的引擎——通过 Function Calling 调用函数。

■ Agent 3：推理与行动的协同——通过 LangChain 中的 ReAct 框架实现自动定价。

■ Agent 4：计划和执行的解耦 —— 通过 Lang Chain 中的 Play - and - Execute 实现智能调度库存。

■ Agent 5：知识的提取与整合——通过 LlamaIndex 实现检索增强生成 Agent。

■ Agent 6：GitHub 的网红聚落——AutoGPT、BabyAGI 和 CAMEL。

■ Agent 7：多 Agent 框架——AutoGen 和 MetaGPT。

此外，我还在附录中简要介绍了科研论文中 Agent 技术进展，旨在为读者提供当前 Agent 技术发展的全面视角并展现相关的探索。

书籍目录：

第1章何为Agent，为何Agent 1

1.1 大开脑洞的演讲：Life 3.0 2
1.2 那么，究竟何为Agent 5
1.3 Agent的大脑：大模型的通用推理能力 9
1.4 Agent的感知力：语言交互和多模态 23
1.5 Agent的行动力：语言输出和工具使用 25
1.6 Agent对各行业的效能提升 28
1.7 Agent带来新的商业模式和变革 32
1.8 小结 39

第2章基于大模型的Agent技术框架 41

2.1 Agent的四大要素 41
2.2 Agent的规划和决策能力 44
2.3 Agent的各种记忆机制 45
2.4 Agent的核心技能：调用工具 46
2.5 Agent的推理引擎：ReAct框架 49
2.6 其他Agent认知框架 66
2.7 小结 68

第3章 OpenAI API、LangChain和LlamaIndex 70

3.1 何为OpenAI API 71
3.2 何为LangChain 91
3.3 何为LlamaIndex 105
3.4 小结 113

第4章 Agent 1：自动化办公的实现——使用Assistants API和DALL·E 3模型创作PPT 115

4.1 OpenAI公司的Assistants是什么 117
4.2 不写代码，在Playground中玩Assistants 118
4.3 Assistants API的简单示例 123
4.4 创建一个简短的虚构PPT 141
4.5 小结 160

第5章 Agent 2：多功能选择的引擎——通过Functions Calling调用函数 161

5.1 OpenAI中的Functions 163
5.2 在OpenAI Playground中定义Function 168
5.3 用Assistants API来实现Functions Calling 173
5.4 用ChatCompletion API来实现Tool Calls 196
5.5 小结 205

第6章 Agent 3：推理与行动的协同——使用LangChain中的ReAct框架实现自动定价 207

6.1 复习一下ReAct推理框架 208
6.2 LangChain中ReAct Agent 的实现 210
6.3 LangChain中的工具和工具包 212
6.4 通过create_react_agent创建鲜花定价Agent 215
6.5 深挖AgentExecutor的运行机制 221
6.6 小结 249

第7章 Agent 4：计划和执行的解耦——使用LangChain中的Plan-and-Execute智能调度库存 251

7.1 Plan-and-Solve策略的提出 252
7.2 LangChain中的Plan-and-Execute Agent 257
7.3 用Plan-and-Execute Agent实现物流管理 258
7.4 从单Agent到多Agent 273
7.5 小结 273

第8章 Agent 5：知识的提取与整合——使用Llama Index实现检索增强生成Agent 275

8.1 何为检索增强生成 276
8.2 RAG和Agent 282
8.3 用LlamaIndex的ReAct Agent来实现花语秘境财报检索 284
8.4 小结 289

第9章 Agent 6：GitHub的网红聚落——AutoGPT、BabyAGI、CAMEL和Generative Agents 292

9.1 AutoGPT 293
9.2 BabyAGI 298
9.3 CAMEL 317
9.4 小结 333

第10章 Agent 7：多Agent系统框架——AutoGen和MetaGPT 335

10.1 AutoGen 336
10.2 MetaGPT 343
10.3 小结 353

第11章下一代Agent的诞生地：科研论文中的新思路 355

11.1 两篇高质量的Agent综述 355
11.2 论文选读：Agent自主学习、多Agent合作、Agent可信度的评估、边缘系统部署以及具身智能落地 358
11.3 小结 359
参考文献 361
后记创新与变革的交汇点 362

如何系统的去学习大模型LLM ？

大模型时代，火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业？”“谁的饭碗又将不保了？”等问题热议不断。

事实上，抢你饭碗的不是AI，而是会利用AI的人。

继科大讯飞、阿里、华为等巨头公司发布AI产品后，很多中小企业也陆续进场！超高年薪，挖掘AI大模型人才！ 如今大厂老板们，也更倾向于会AI的人，普通程序员，还有应对的机会吗？

与其焦虑……

不如成为「掌握AI工具的技术人」，毕竟AI时代，谁先尝试，谁就能占得先机！

但是LLM相关的内容很多，现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学，学习成本和门槛很高。

针对所有自学遇到困难的同学们，我帮大家系统梳理大模型学习脉络，将这份 LLM大模型资料 分享出来：包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁：全网最全《LLM大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）👈

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点，那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套LLM大模型报告合集

这套包含640份报告的合集，涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)

在这里插入图片描述

三、LLM大模型系列视频教程

在这里插入图片描述

四、LLM大模型开源教程（LLaLA/Meta/chatglm/chatgpt）

在这里插入图片描述

LLM大模型学习路线 ↓

阶段1：AI大模型时代的基础理解

目标：了解AI大模型的基本概念、发展历程和核心原理。
内容：
- L1.1 人工智能简述与大模型起源
- L1.2 大模型与通用人工智能
- L1.3 GPT模型的发展历程
- L1.4 模型工程
- L1.4.1 知识大模型
- L1.4.2 生产大模型
- L1.4.3 模型工程方法论
- L1.4.4 模型工程实践
- L1.5 GPT应用案例

阶段2：AI大模型API应用开发工程

目标：掌握AI大模型API的使用和开发，以及相关的编程技能。
内容：
- L2.1 API接口
- L2.1.1 OpenAI API接口
- L2.1.2 Python接口接入
- L2.1.3 BOT工具类框架
- L2.1.4 代码示例
- L2.2 Prompt框架
- L2.3 流水线工程
- L2.4 总结与展望