Agent智能体？我们要的到底是什么

最新推荐文章于 2024-09-26 22:56:06 发布

IT猫仔

最新推荐文章于 2024-09-26 22:56:06 发布

阅读量1k

点赞数 18

文章标签：数据库网络 windows

本文链接：https://blog.csdn.net/2301_82275412/article/details/140894989

版权

What is an agent?

❝

近年来，大型语言模型（LLM）的能力越来越强，应用范围也越来越广泛，其中一个热门方向就是智能体（Agent）。但在这一切的背后，我们真正追求的是什么？是简单地让机器执行命令，还是赋予它们更多的智能体特性（Agentic features），使它们能够更加自主地参与决策过程？

本文将深入探讨智能体的概念、为何“具有智能体特性”变得如此重要，以及这一趋势如何影响我们对未来技术的构想。

什么是智能体？

传统应用程序通常遵循预先定义好的规则和逻辑，而智能体则不同，它可以根据LLM的理解和判断，动态地选择下一步操作，这使得智能体能够处理更加复杂和不确定的任务。

简单来说，智能体就是一个利用LLM来决定应用程序控制流程的系统，可以被视为一种能够自主决策和执行任务的系统。它通过与外部数据和计算资源的交互，来实现复杂的任务。

智能体与传统应用程序的区别

以LangChain生态为例，通过LangChain创建的很多LLM应用的工具，特别是那些作为推理引擎并与外部数据源和计算资源交互的系统，这些系统通常被称为智能体。

❝

智能体的定义可能因人而异。技术上讲，智能体是一个利用LLM来决定应用程序控制流程的系统。

然而，这样的定义并不完美。人们往往认为智能体是高级的、自主的、类似人类的系统，但一个简单的系统也可以通过LLM在两条不同路径之间进行路由，这也符合技术定义。这表明，智能体的定义并不单一，而是具有多样性。

举个例子，想象一下一个智能客服机器人。传统的客服机器人只能根据预设的关键词进行简单的问答。但智能客服机器人则可以利用LLM理解用户的真实意图，并根据情况选择不同的对话策略，例如：

如果用户只是询问简单的信息，智能客服机器人可以直接给出答案。
如果用户的问题比较复杂，智能客服机器人可以引导用户提供更多信息，或者将用户转接到人工客服。

Agentic意味着什么？

Agentic可以理解为“具有智能体特性”。一个系统越“具有智能体特性”，就意味着LLM在决定系统行为方面的作用越大。

Agentic谱系

我们可以把Agentic看作一个连续谱系：

一端是完全没有Agentic的系统。 这些系统完全按照预设的规则运行，LLM的作用仅仅是提供信息或执行简单的指令。
另一端是完全Agentic的系统。 这些系统的行为完全由LLM决定，甚至可以自己设定目标和计划。

当然，大多数实际系统都处于这个谱系的中间地带。例如，一个智能客服机器人可能在回答简单问题时没有Agentic，但在处理复杂问题时就需要一定的**Agentic。

吴恩达提出了一个观点，即智能体的能力可以被视为一个谱系，就像自动驾驶车辆有不同的自动化等级一样，智能体的能力也可以有不同的等级,因而在现阶段使用Agentic定义比Agent更加合适。这个观点得到了广泛的认同，并且有助于更好地理解智能体的不同层次。

LLM的作用程度

根据系统中LLM的作用程度，可以将智能体划分为不同的等级：

路由器（Router）：使用LLM将输入路由到特定的下游工作流，这种行为具有一定的“智能体特性”。
状态机（State Machine）：如果系统使用多个LLM进行多次路由步骤，并且其中一个步骤决定是否继续或结束，这种系统就类似于状态机。
自主智能体（Autonomous Agent）：如果系统能够构建工具、记住这些工具并在未来的步骤中使用它们，这种系统就具有高度的智能体特性。

尽管这些定义看起来比较技术性，但在设计和描述LLM系统时，这些技术定义是非常有用的。

Agentic为何有价值？

理解Agentic的概念对于构建和使用基于LLM的系统至关重要。它可以帮助我们：

选择合适的系统架构。 对于一些简单的任务，可能并不需要Agentic，传统的应用程序就足够了。但对于一些复杂的任务，就需要考虑构建具有Agentic的系统。
设计更有效的交互方式。 对于具有Agentic的系统，我们需要设计更灵活的交互方式，以便LLM能够充分发挥其作用。
评估系统的性能。 对于具有Agentic的系统，传统的评估指标可能不再适用，我们需要探索新的评估方法。

总而言之，Agentic是一个需要根据具体问题和应用场景进行权衡的因素。

更进一步说，理解你的系统可以有多“具有智能体特性”，可以在开发过程中指导你的决策——包括构建、运行、交互、评估，甚至监控。