AI Agent(智能体):从技术概念到场景落地

AI Agent(AI代理)是一种能够感知外部环境、进行自动决策和执行动作的智能实体。

不同于传统的人工智能, AI Agent 具备通过独立思考、调用工具去逐步完成给定目标的能力。

受限于数据和算力限制, 想要实现真正智能的 AI Agents 缺乏必要的现实条件。

大模型、AI agent、RPA

大语言模型和 AI Agent 的区别在于 AI Agent 可以独立思考并做出行动,和 RPA 的区别在于它能够处理未知环境信息。

在AI领域,大语言模型与人的互动是基于一种称为“提示词”(prompt)的机制实现的。用户所提供的提示词的明确性和准确性对模型回答的质量具有直接影响。一些强大的AI工具也需要用户明确地描述任务需求,才能提供有效的解决方案。

AI智能体(Agent)只需为其设定一个目标,它便能够独立地进行思考和行动。AI智能体能够对目标任务进行详尽的拆解,制定出具体的执行步骤,依赖于外部反馈以及自身的智能处理能力,自主地生成执行任务所需的提示词(prompt),以实现预设目标。

RPA主要在既定规则和预设流程下执行任务,面对充满未知和不可预测的环境时,RPA的处理能力受限。AI智能体则能够通过与环境的互动,感知并适应新信息,进行相应的思考和行动调整,从而在复杂多变的环境中实现目标任务。

人与AI交互模式

人类与人工智能(AI)之间的互动大体上可分为三种主要模式:

  • 嵌入式模式(Embedding Mode):大语言模型能够补充信息的空缺,执行一些子任务,例如信息摘要等。用户将对AI提供的信息进行筛选和整合,以完成最终的任务。

  • 协同驾驶模式(Copilot Mode):AI能够根据用户定义的流程执行任务,如撰写文稿或根据特定需求进行编程。然而此模式对用户的指令(Prompt)提出了更高的要求。AI完成任务流程后,用户需要对结果进行审查和调整,以确保工作的正确性和有效性。

  • 智能体模式(Agent Mode):用户需要为AI设定目标、定义角色,并提供完成任务所需的工具。通过更复杂的指令(Prompt),AI能够独立拆分任务、利用工具,并最终完成任务。用户的角色转变为设定目标、提供必要资源和监督任务的执行结果。

这三种模式展示了从用户主导到AI主导的连续统一体,每种模式都适用于不同的应用场景和需求。

AI智能体的架构

AI智能体的构建以大型语言模型(LLM)为核心,并通过四个关键模块来实现其功能:

  • 记忆模块:智能体如同人类一样具备记忆能力,能够保留所学知识和交互习惯。这种记忆机制使得智能体能够在处理相似任务时借鉴以往的经验,减少用户的重复性工作。

  • 短期记忆负责处理即时的上下文信息,与我们日常和ChatGPT的互动类似;

  • 长期记忆则存储知识和历史交互,使智能体能够提供基于丰富数据和经验的、更为专业和个性化的服务。

  • 规划模块:智能体能够将复杂的任务分解为多个子目标,并逐一规划和解决。在完成每个任务后,智能体会进行自我反思,评估和总结执行过程中的问题,如内容的重复输出或在某个子目标上花费时间过长,并将这些经验教训纳入长期记忆中,以避免未来犯同样的错误。

  • 工具模块:智能体能够利用各种工具来补充自己的能力,特别是通过调用外部应用程序接口(API),来扩展自己的功能。可以调用访问互联网的API来获取最新的信息。

  • 行动模块:智能体将通过一系列有序的步骤来实施计划。它首先回顾以往的工作经验和记忆,然后规划出实现子目标的策略,并选择合适的工具来解决问题,最终将结果呈现给用户,并进行最后的反思。

这四个模块共同构成了智能体的框架,使其能够在自动化、个性化服务等方面发挥关键作用。

提示词艺术

构建一个高效的提示词(Prompt)是实现理想AI输出的关键,它应当遵循以下几个原则:

1. 明确性:一个优质的提示词首先需要设定一个清晰的任务目标,包括预期的成果和效果。这为AI提供了一个明确的执行方向。

2. 指导性:提示词应当提供具体的指引和限定条件,这可能包括给出一些示例或明确界定回答的范围,以引导AI模型生成恰当的输出。

3. 简洁性:使用的语言应该直接而明确,避免冗长和复杂。一个清晰的提示词有助于AI更准确地把握用户的意图。

4. 可迭代性:由于一次给出的提示词可能无法完全达到预期的效果,因此用户需要根据AI的反馈持续对提示词进行调整和优化,这是一个动态的迭代过程。

通过遵循这些原则,用户可以更有效地与AI进行交流,从而获得更加准确和有用的回答。

单智能体 vs 多智能体

单一智能体与多重智能体各自拥有独特的优势,并适用于不同的专业领域。

单一智能体的运作依赖于强化学习,其理论基础是马尔可夫决策过程。涉及到三个核心要素:状态集(S)、行动集(A)、奖励(R)。智能体的下一个状态和获得的奖励仅取决于它前一个动作,而与之前的历史状态无关。这种学习机制鼓励智能体通过尝试和错误来探索环境:当某个行为策略导致正面的奖励时,智能体将增加采取该策略的倾向。其最终目标是在特定环境中采取行动,以获取最大的累积奖励。

这种类型的智能体在许多领域都有应用,如在赛车游戏的AI训练中,智能体需要学习如何操作方向盘、油门和刹车等,通常可以通过DDPG、A3C、PPO等算法进行决策。同样,在像围棋这样的策略游戏中,AlphaGo智能体就是通过Q-Learning等算法来决策的。

多智能体系统涉及更复杂的互动,其中每个智能体的决策不仅受自己的行为影响,还受到系统中其他智能体行为的影响。在这种系统中,至少有两个智能体相互作用,它们可能处于合作或竞争的关系之中。这种模型被称为马尔科夫博弈,其中状态转移符合马尔可夫性质,而智能体之间的关系符合博弈论的原则。

在多智能体模型中,每个智能体都试图找到最优策略,以确保在任何给定状态下都能获得最大的长期累积奖励。由于这种模型的复杂性和众多的干扰变量,目前市场上的商业化多重智能体产品还相对较少。

大模型图谱

在这里插入图片描述

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值