永结无间Ⅸ--你不需要LLM Agent

人们将目光锁定在下一个闪亮的事物上。FOMO 是人性的一部分。这也适用于企业。就像数据科学成为每个企业分析功能的热潮一样,Agentic Architecture 是大多数 AI 雷达上的热门目标。

但您是否考虑过您是否真的需要它?

实际情况是,您不需要 Agentic Architecture,并且最好不要在您的业务中使用 Agentic Architecture。

1 分钟了解 LLM 代理和代理架构

在我深入探讨原因之前,让我们先快速了解一下 LLM 代理的含义。

从语义内核编排的角度来看,人工智能代理是一个模块化抽象,它可以拥有角色,可以响应用户输入执行操作,并且可以轻松地与其他代理通信。来源:微软开发者博客

本质上,Agent可以看作是一个使用LLM设计的自动机,可以执行以下操作:

  • 扮演角色
  • 弄清楚如何完成一项任务
  • 执行任务
  • 做决定
  • 与其他代理商沟通

在代理架构中,您将拥有一大群这样的 LLM 代理,每个代理之间都有直接的沟通渠道,以完成一项复杂的任务。您通常需要植入一个经理角色的代理来确定任务是否已完成,或者您的代理是否会开始无休止地讨论周末计划或生活的意义。


示例:用于生成博客文章的 Agentic 架构

乍一看这听起来非常合乎逻辑。

事实上,大多数团队都是这样运作的。

所以有什么问题?

问题1:为什么你还没有它?

百万美元的创意通常始于解决我们自己的日常痛点。如果我们从未进一步实施它,通常意味着以下一项或多项是正确的:

  • 我们不知道该怎么做。如果你不知道该怎么做,你很可能也不知道它是否已经正确实施。
  • 我们没有时间/资源去做这件事。
  • 我们实际上并不需要它。就像我不需要商用油炸锅来制作一批鸡翅一样。
底线:不要为了使用而使用技术。

如果您的团队已经考虑过一段时间是否需要 Agentic 架构,那么您可能还没有开始开发/采购它。在这种情况下,我建议您坚持下去,不要害怕错过。会有更好的架构/实现。

如果你不相信的话,那我们就继续下一个问题吧。

问题 2:依赖互联网讨论来解决业务问题

LLM 之所以令人惊叹,是因为他们所输入的数据量非常大。

OpenAI 使用以下信息来训练模型:(1) 互联网上公开的信息、(2) 从第三方获得许可的信息,以及 (3) 用户或人类训练师提供的信息。

虽然您可能在网上找到关于银行通常如何进行反洗钱 (AML) 检查的讨论,但您可能无法找到您的竞争对手或客户的竞争对手实际如何经营业务的实际审计线索。

换句话说,如果您想使用 LLM 代理来自动化您的业务流程,那么您将陷入这两个选项之间:

  • 利用 Reddit 上的网络传闻来经营你的企业
  • 使用精心策划的数据集来微调你自己的 LLM
LLM 微调值得在单独的博客文章中介绍。您和您的企业可能需要针对不同的业务流程微调多个模型。在服用红色药丸之前,请确保您已为这一旅程做好准备。

您可能会说,对于业务关键性较低且价值较低的任务,LLM 代理仍然是有效的选择。但在那时,当您可以直接将 LLM 与云提供商一起使用时,是否仍然值得投资设置和采用该框架?

问题 3:以创造力的名义将业务流程转变为掷骰子

大多数大模型语言项目都无法解决突破性的问题

是的,LLM 已被用于帮助探索核聚变的可能性。

但让我们现实一点,如果您正在考虑使用 LLM 代理来自动化部分业务流程,那么这些流程可能是您和您的团队以前执行过的。这意味着有一个协议/程序需要遵循,或者有完成这些任务的方法。

我们需要问自己的问题是:在执行任务时,我们真的需要 LLM 的创造力吗?或者我们真的希望 LLM 遵循以前的任务完成方式,并在此过程中的每个步骤中自动生成文本/图像?

如果我们真的想让 LLM 代理弄清楚如何执行任务,我们可能会看到每次执行的审计跟踪都富有创意。执行顺序会有所不同,中间输出格式可能不一致,有时,代理甚至可能需要很多轮才能获得不令人满意的结果。曾经清晰的协议将变得富有创意或统计上不可预测。

如果计划开始将 GenAI 更大规模地整合到业务中,那么让 LLM 按照规则行事通常会产生更可审计、调试和稳定的结果。如果是这样的话,LLM 代理会带来什么好处呢?我们不妨剪掉翅膀,选择 LLM 管道。

潜在解决方案:大模型语言(LLM) 管道

如果说数据科学的炒作教会了我们什么,那就是操作化的重要性。如果没有办法将尖端分析/技术集成到现有系统/流程中,那么一旦热潮消退,你就会发现自己陷入巨大的技术债务和孤岛之中。


尽管各种周期性炒作仍在继续,但数据工程、DevOps 和 MLOps 始终保持相关性,原因如下:它们都与透明度、稳健性和可靠性有关。我们也应该以这种方式考虑 LLM 的采用。

将你的 LLM 代理计划转换为经过充分记录和测试的 LLM 管道,每个管道包含原子步骤,每个步骤都具有定义的输入和输出数据结构。这让你能够真正思考在 GenAI 成为现实之前你是如何执行任务的。这还允许你调试 LLM 管道出错的地方。这最终将把原本庞大的 LLM 代理黑匣子缩小为概率口袋,因为你已经定义了高级工作流程和执行顺序。

​​​​​​​欢迎前往我们的公众号,阅读更多时事资讯​​​​

创作不易,觉得不错的话,点个赞吧!!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值