LLM时代下的智能体

大模型官方资料

于 2024-08-03 21:07:13 发布

阅读量304

点赞数 7

文章标签：人工智能语言模型自然语言处理深度学习

本文链接：https://blog.csdn.net/xzp740813/article/details/140896957

版权

01 什么是智能体

其实早有人类提出相关技术解决上述问题, 那就是智能体, 智能体（AI Agents或 Agents)，一般认为是一个可以通过行动能力自主完成设定的目标的代理。“智能体”是和“智能”密不可分的；它具备一些类似人的智能能力和行为，比如学习、推理、决策和执行能力。

AI Agents的概念是早于LLM(大语言模型, Large Language Model), Agent概念最早起源于M.Minsky(AI之父之一）于1986年出版的《Society of Mind》（也是神经网络热潮开始的年份）, 只是LLM出现, LLM的涌现能力让人们快速嗅到可以基于LLM打造智能体, 近期 Web GPT、Chatdev、Toolformer、Devin、MetaGPT等AI Agents产品也是层出不穷。

02 LLM时代下的智能体

LLM给AI Agents底层提供了一个突破性技术方案：过去强化学习基于深度学习框架可让agent学到技能，但agent本身并没有真正理解问题和技能，泛化性也较差，只能用于特定领域，主要用在游戏和用来制作低维控制/计划，代表性应用是围棋领域的AlphaGo；LLM带来了深度学习新范式，思维链和强大的自然语言理解能力有望让agents具备强大的学习能力和迁移能力，从而让创建广泛应用且实用的agents成为可能。

2023年11月，OpenAI 上线 GPTs 功能，全球AI开发者闻风而动；2024年1月，OpenAI 正式上线 GPT Store，开启了构建AI 智能体的风潮。

最近，人工智能著名学者、斯坦福大学教授吴恩达指出：AI Agents工作流将在今年推动人工智能取得巨大进步，甚至可能超过下一代基础模型。 这是一个重要的趋势，他呼吁所有从事人工智能工作的人都关注 AI Agent 工作流。

由于生成式LLM存在幻觉问题，记忆力短，在实际应用中难以保持长期一致性和准确性，且agents间合作也是重要趋势，除了等待基座模型自身迭代之外，借助外部力量（向量存储、检索、代码等）是重要方法，完整的Agents框架应该具备这些能力。我们认为补齐了大模型短板的AI Agents更具备实用性，将是大模型重要落地方向。前特斯拉总监、 OpenAI科学家Karpathy公开表示“如今AI智能体才是未来最前沿的方向”“相比大模型训练，OpenAI内部目前更关注Agents领域”。

LLM时代下的智能体也是现在很多应用发展方向, 逐渐成为下个APP的趋势。

03 LLM时代下智能体架构

一个大语言模型智能体框架包含以下4个核心部分(这不是AI Agents所有模块,目前AI Agents也在不断发展)：

用户请求 - 表达用户的问题或请求
智能体/大脑 - 作为协调者的智能体核心
规划- 助于智能体为未来行动做规划
记忆 - 管理智能体的历史行为和经验

LLM智能体如下架构:

通过这些组成部分的协同工作，大语言模型智能体能够处理从简单到复杂的各种请求，不仅能够提供直接的答案，还能解决需要深度分析和多步骤操作的问题。这种智能体的能力，使其在处理复杂信息查询、数据分析和可视化表示等方面具有巨大潜力。

04 LLM Agent组件拆解

第3节提到Agent 最重要的三大组件: 规划、记忆、工具, 每个组件可以进一步进行拆分。

深入智能体,要求我们有基本的提示词的经验。

这个并不是AI Agents所有设计模式, 结合吴恩达近期发表的言论, 他将AI Agents 框架分为4个方面:

反思(reflection)：LLM 检查自己的工作，以提出改进方法。
工具使用(Tool use)：LLM 拥有网络搜索、代码执行或任何其他功能来帮助其收集信息、采取行动或处理数据。
规划(Planing)：LLM 提出并执行一个多步骤计划来实现目标（例如，撰写论文大纲，然后进行在线研究，然后撰写草稿…）。
多 Agents 协作(Multi-agent collaboration)：类似分而治之,利用每个agent在特定领域的优势,多个 AI Agent 一起工作，分配任务并讨论和辩论想法，以提出比单个智能体更好的解决方案。

其中多Agents协作,也是目前开源 Agents 工具和有关 Agents 的学术正在研究的方向之一

05 著名LLM的智能体

现在已经有很多著名的大语言智能体, 包括但不限以下智能体:

名称	地址	说明
Horton	https://arxiv.org/abs/2301.07543	通过给予基于大语言模型（LLM）的智能体以“资产、偏好及个性”，模拟人类在经济行为场景中的决策过程。
盲审	https://arxiv.org/abs/2301.05327	利用多个语言模型模拟法官的判决过程，其对现实世界最高法院裁决的预测准确度高于随机水平。
ChemCrow	https://arxiv.org/abs/2304.05376	描述了一个专注于化学领域的大语言模型智能体，该智能体能够独立规划并执行驱虫剂、有机催化剂的合成及新型色素的开发。
EduChat	https://arxiv.org/abs/2308.02773	专为教育领域设计的两个杰出的大语言模型智能体。类似的还有CodeHelp
ChatDev	https://arxiv.org/abs/2307.07924	展示了 AI 智能体在自动化编程、调试、测试及支持软件工程其他任务方面的潜力。类似的还有ToolLLM、MetaGPT
Mehta	https://arxiv.org/abs/2304.10750	提出了一种互动框架，允许建筑师与 AI 智能体合作，在三维模拟环境中设计建筑。
OS-Copilot	https://arxiv.org/abs/2402.07456	提供了一个创新框架，旨在打造能够全面操作操作系统 (OS) 的通用智能体，这些智能体能够灵活应对网络浏览、编码操作、文件管理、多媒体处理及与众多第三方应用的交互。
.......		........

06 总结

大模型时代的AI Agents = LLM（核心控制器，构建核心能力）+ 规划能力 + 记忆 + 工具+…。

这个时代关于Agents的学术文献正在激增。AI Agents也在不断发展, AI Agents的组件或者架构也在不断丰富,但是作为AI Agents的基座模型能力至关重要。

读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型！

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

👉AI大模型学习路线汇总👈

大模型学习路线图，整体分为7个大的阶段：（全套教程文末领取哈）

第一阶段： 从大模型系统设计入手，讲解大模型的主要方法；

第二阶段： 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段： 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段： 大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段： 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段： 以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段： 以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频，看书籍和视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。
在这里插入图片描述

👉学会后的收获：👈

• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求： 大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能， 学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力： 大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

👉获取方式：

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

大模型官方资料

关注

7
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
LLM时代下的智能体

其实早有人类提出相关技术解决上述问题, 那就是智能体, 智能体（AI Agents或 Agents)，一般认为是一个可以通过行动能力自主完成设定的目标的代理。“智能体”是和“智能”密不可分的；它具备一些类似人的智能能力和行为，比如学习、推理、决策和执行能力。AI Agents的概念是早于。
复制链接

扫一扫