Agent基础知识学习,看这一篇就够了!

什么是 Agent

OpenAI的研究员 Lilian 写过一篇博客:《 LLM Powered Autonomous Agents》,将 Agents 定义为:LLM + memory + planning skills + tool use,即大语言模型、记忆、任务规划、工具使用的集合

Overview of a LLM-powered autonomous agent system.

大语言模型 (LLM)是 Agent 的大脑,要求 Agent 具备以下 3 种能力来配合大脑完成任务:

  1. 任务规划(planning skills):对问题进行拆解得到解决路径,既进行任务规划。
  2. 工具使用(tool use):评估自己所需的工具,进行工具选择,并生成调用工具请求。
  3. 记忆(memory):短期记忆包括工具的返回值,已经完成的推理路径;长期记忆包括可访问的外部长期存储,例如知识库
任务规划
  • 子目标 & 拆解(Subgoal and decomposition) :我们处理问题的时候会采用“分治”的思想,将复杂任务拆解成一个个小任务处理。这个在 Agent 的实现中也是一样,一个复杂任务不太可能一次性就能解决的,需要拆分成多个并行或串行的子任务来进行求解,从而提升处理复杂问题的能力。
  • 反思 & 完善(Reflection and refinement) :Agent 能够对过去的行动决策进行自我反思,完善过去的行动决策和纠正以前的错误来迭代改进。ReAct 提示词技术就是很经典的反思和完善过程。结合 ReAct 提示词技术的 Agent 会在执行下一步action的时候,加上 LLM 自己的思考过程,并将思考过程、执行的工具及参数、执行的结果放到 prompt 中,让 LLM 对当前和先前的任务完成度有更好的反思能力,从而提升模型的问题解决能力。

ReAct 的提示模板,大致格式如下:

Thought: ... 
Action: ... 
Observation: ... 
...(重复以上过程)

记忆

记忆可以定义为用于获取、存储、保留以及随后检索信息的过程。人脑中的记忆可以划分为:

  • 感知记忆(Sensory Memory) :这是记忆的最早阶段,提供在原始刺激结束后保留感觉信息(视觉、听觉等)印象的能力。感知记忆通常只能持续几秒钟。子类别包括图像记忆(视觉)、回声记忆(听觉)和触觉记忆(触摸)。感知记忆作为原始输入的学习嵌入表示,包括文本、图像或其他形式。
  • 短期记忆(Short-Term Memory (STM) ) :它存储我们当前意识到的以及执行学习和推理等复杂认知任务所需的信息。
  • 长期记忆(Long-Term Memory (LTM)) :长期记忆可以存储相当长的时间信息,从几天到几十年不等,存储容量基本上是无限的。 LTM 有两种亚型:
    1. 外显/陈述性记忆:这是对事实和事件的记忆,是指那些可以有意识地回忆起来的记忆,包括情景记忆(事件和经历)和语义记忆(事实和概念)。
    2. 内隐/程序性记忆:这种类型的记忆是无意识的,涉及自动执行的技能和例程,例如骑自行车或在键盘上打字。

在 Agent 中进行类比:

  • 感知记忆:最原始的 embedding、文本、图像输入。
  • 短期记忆:可以理解为多轮对话的上下文窗口,受到 Transformer 有限上下文窗口长度的限制,所以尽管对话很长,短期记忆理想情况只保留大模型能够处理的上下文窗口的上限,如果是 first in first out 的模式,则只保留最近的几次对话内容。
  • 长期记忆:可以理解为外置知识库,在 Agent 处理任务的过程中作为额外检索数据的地方。
工具使用

尽管大语言模型在预训练阶段学习了大量的知识,但只能够与大模型“纸上谈兵”,它只会说、不会做,同时也不能回答一些如天气,时间之类的简单问题。Agent 对于工具的使用就是弥补大模型只说不做的缺陷。Agent 可以调用外部 API 来获取模型权重中缺失的额外信息,包括当前时间、地理位置信息、代码执行能力、对专有知识库的访问等。


Agent 的工作机制

  1. 【接收任务】用户提交任务给 Agent。
  2. 【组装提示词】Agent 收到用户提交的任务之后,对输入信息进行架构处理合并为最终的 prompt。
  3. 【与大模型交互】Agent 将处理后的 prompt 提交给 LLM,拿到下一步需要执行的动作和思考过程。
  4. 【循环执行】Agent 会执行 LLM 返回的 Action、观察评估结果、获取下一步 Action。执行的工程中会自主的判断是否需要使用工具来处理 Action 或者获取额外的信息。

如何学习AI大模型 ?

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

😝有需要的小伙伴,可以VX扫描下方二维码免费领取🆓

👉1.大模型入门学习思维导图👈

要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。

对于从来没有接触过AI大模型的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。(全套教程文末领取哈)
在这里插入图片描述

👉2.AGI大模型配套视频👈

很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。

在这里插入图片描述
在这里插入图片描述

👉3.大模型实际应用报告合集👈

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(全套教程文末领取哈)

在这里插入图片描述

👉4.大模型落地应用案例PPT👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。(全套教程文末领取哈)

在这里插入图片描述

👉5.大模型经典学习电子书👈

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。(全套教程文末领取哈)
img

在这里插入图片描述

👉6.大模型面试题&答案👈

截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。(全套教程文末领取哈)

在这里插入图片描述
👉学会后的收获:👈
基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习

这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值