大语言模型智能体(LLM Agents)入门指南

模型优化师

于 2024-10-08 14:19:26 发布

阅读量346

点赞数 7

文章标签：语言模型人工智能自然语言处理 ai agi LLM Agent

本文链接：https://blog.csdn.net/2401_85325557/article/details/142758533

版权

“本文将探讨如何让大型语言模型（LLM）通过智能体（Agents）独立解决复杂任务。”

人类具备一项非凡的能力，那就是能够持续吸收信息、做出决策、采取行动、观察变化，并由此做出下一个决策。**我们的整个生命就是一个永无止境的观察、思考和行动的循环。**研究人员希望将这个概念应用到大型语言模型（LLM）中，使其能够不断做出新的决策，逐步接近具备解决复杂问题的能力。

人类通过将复杂问题分解为易于管理的小部分，并不断利用前人积累的知识，已经取得了长足的进步。现在我们已经到达了私营企业建造火箭、工厂完全由机器人操作的阶段，这个过程耗费了40亿年。

历史长河中的进步与创新

这并非终点，我们的经济虽然在不断地增长，而想要进一步加速进步只能依靠颠覆性的理念。**其中，生成式人工智能无疑是重要的一环，它不仅能生成新的内容，还能解释文本和观察结果并自主做出决策。**通过不断分析观察和做出决策，我们推动着进步，直到最终在火星上建造城市、实现永生，或是实现任何我们想要达到的目标。

现在以及未来的进步与创新

然而，今天我们还没有完全做到这一点，因为现有的每个人工智能模型都只模仿了人类智能的某个特定方面。例如，大型语言模型在理解和创作文本方面非常出色，其能力甚至超过了人类。但是，当涉及到简单的算术任务时，大型语言模型往往会遇到困难。

那么，如何让它们能够独立解决更复杂的问题呢？—— 其中一种方式是利用智能体 (Agents) 的概念。

01、什么是智能体

科幻电影和间谍电影中经常出现一种中央人工智能，它与主角交流，搜索互联网和各种秘密数据库，引导主角完成任务。例如电影《钢铁侠》中的贾维斯（J.A.R.V.I.S.）就是一个典型例子。

是什么让贾维斯如此特别？钢铁侠甚至不需要告诉它如何解决问题，它会自己找到方法。

这正是我们希望通过智能体实现的目标。

02、如何构建智能助手

核心毫无疑问是超级强大的大型语言模型，它能够理解问题、观察环境并基于此做出决策。除此之外，再加上一些将语音转换为文本的模型以及解释图像内容的模型，我们就拥有了构建自己的“贾维斯”所需的一切。

智能助手需要掌握的技能

03、如何连接各项技能 - 智能体背后的理论

智能体是一种可访问一系列工具的组件。其主要特征在于它能够做出明智的决策并利用适当的工具，直到找到足够好的答案。

在大型语言模型应用方面，智能体的概念可能是最引人注目的进展。它让我们梦想着拥有一个能够自主控制流程、进行研究或通过找到生存概率最高的方案来拯救超级英雄的人工智能。

当我们应用智能体的概念时，我们不仅仅使用大型语言模型来回答问题，而是将其作为大脑，处理它看到的观察结果并决定接下来要做什么。我们人类一直在做着同样的事情：面对要解决的任务，寻找能够帮助我们尽可能轻松地完成任务的方法和工具。

人类可以使用工具解决问题

通过应用这种概念和使用正确的工具，计算机也能够解决复杂的查询。例如，如果我们使用大型语言模型将文本转换为SQL，当执行生成的SQL时发生错误，LangChain 的 SQLAgent 不会轻易放弃，而是尝试解释错误并修正问题。

刚刚提到的SQL智能体使用了一套名为 SQLDatabaseToolkit 的 LangChain 工具。目前可用的工具并不局限于SQL。本文将在下面详细介绍 LangChain 已经提供的工具，不过请记住，工具可以是任何东西。之前提及大型语言模型在简单的分析计算方面有时表现不佳，因此解决这类问题需要的是一个能够识别分析任务并使用计算器解决问题的智能体。

OpenAI的ChatGPT已经做到了这一点。如果你通过Plus订阅发送请求，你会看到一个分析步骤，聊天机器人根据分析的结果决定如何响应请求。它会从一系列工具中进行选择，例如Python REPL用于解决分析任务，需要最新信息时使用网络搜索，用户要求创建图像时使用Dall-E3等等。