简说目前市面上最流行的“AI Agentic”

背景

当吴恩达在布道完著名的Agent设计模式后

他于不久后又引领了AI界的开发们开始关注另一种高级开发模式,即"Agentic",吴恩达多次反复强调:“Agentic是比Agent更具未来”。

那么什么是Agentic呢?

什么是AI Agentic

AI Agentic即代理人工智能。

当我们谈论代理人工智能时,其实指的是一类目标实现自主操作的人工智能系统。这意味着,设计用于做出决策并与环境互动以实现特定的目标。为此,代理人工智能必须能够感知其环境,收集和处理数据,并执行操作以实现预定义目标。 

与需要人工监督并遵循预定义规则的传统人工智能系统不同,代理人工智能有望动态地调整与优化其性能。

代理人工智能与传统人工智能系统的区别

代理人工智能在许多关键方面与传统人工智能系统有所不同,主要是在自主性和适应性方面。

自主性意味着传统的人工智能系统可能需要监督或人工干预才能执行任务。它们根据预定义的规则和脚本运行,这限制了它们适应新情况的能力。另一方面,代理人工智能却能够自主运行、做出决策,并在没有持续人工监督的情况下采取行动。这种自主性使它们能够更有效地管理复杂而动态的环境。

至于适应性,这与传统人工智能模型通常缺乏随时间学习和适应的能力形成对比。它们是为特定任务而设计的,难以应对超出其训练数据范围的场景。另一方面,代理人工智能使用机器学习技术不断从新数据和经验中学习。这种适应能力使它们能够提高性能并管理更广泛的任务。

Agentic Workflow

拿写文章做类比。例如和另一个人说:“想让你为我写一篇关于给定主题的文章,需要一次性打字从头到尾”,虽然人们可以这样写,但实际上我们没有用这种方式写出很好的作品。

但是,我们可以用工作流来做更好的思考和写作,如从大纲、到研究、初稿、批判等,这是一个迭代的过程,这一系列迭代的工作流可以让我们自己更好的工作产品。

Agentic Workflow 能做到完成拆解的各任务环节,我们已经看到许多具有 Agentic Workflow 的 AI 应用的准确性有了巨大提高。同样,工作流的瓶颈之一也在于推理能力,因为用户使用产品需要反复调用 LLM,所以我们需要更快的推理能力来实现预期效果。

AI Agent 具备自我批判能力,在工作流中可以检查步骤,然后修正自己的错误

吴恩达举了个例子,之前做过一个在线写调研报告的 Agent,某次在斯坦福大学给一个小组做演示,不知什么原因,那次调用网页搜索失败了,可能是 API 调用错误;但是这个 Agent 发现调用网络搜索失败之后,转而去用维基百科搜索代替。

其实他本人都忘了自己给 Agent 做了联网搜索和维基百科搜索的能力,而这个编写出的 Agent 足够聪明,当网络搜索失败时,它转向维基百科搜索,然后成功完成那次 demo。

AI Agent 也许也会出错、有缺陷,但当 Agentic Workflow 可能在某个步骤上出错时,它会发现是什么错误、自我批判修正,这会使它们更加稳健。AI Agent 在这方面就像人类一样,当我们做一些事情时,很多事情第一次都不起作用,但我们反思、批判和修复的能力,使人类的行动与思想更加强大。建立在当前模型基础上的 Agentic Workflow 可以让我们在做有商业价值的应用上取得很大进展。

Agentic Workflow的准确定义和关键特点

准确定义

Agentic Workflow 是与大型语言模型(LLM)交互和完成任务的一种新方法。它通过将任务分解为多个子任务,并引导AI代理按步骤完成每个子任务,从而优化工作流程。

任务分解

将复杂的任务分解为更小的、可管理的子任务,每个子任务的输出将作为下一步的输入,以此循环往复。

AI代理(Agent)

AI代理是Agentic Workflow的核心,负责执行特定的子任务。每个代理可能负责工作流中的一个或多个特定环节。

自主性和自我决策能力

Agentic AI具备高级的认知能力,能够进行复杂的情境感知和环境理解,并在面对新情况时做出合理的判断和决策。

适应性和学习能力

Agentic AI能够从经验中学习,不断调整自己的行为以适应不断变化的环境,能够根据实时数据和环境变化动态生成策略。

模块化架构

Agentic Workflow采用模块化设计,每个模块或组件负责特定的任务或功能,这种设计允许灵活地添加、更新或替换模块。

智能体网络

在Agentic Workflow中,AI Agent形成一个网络,每个Agent拥有自己的专长和责任,通过网络协作,共同处理复杂的任务。

自适应循环

Agentic Workflow包含一个自适应循环,其中AI Agent不断收集反馈,评估性能,并根据反馈调整自己的行为,确保工作流的持续优化和改进。

交互式界面

Agentic Workflow提供了交互式界面,支持自然语言交互和可视化操作,提高了用户体验和系统的可访问性。

数据和知识管理

Agentic Workflow需要一个强大的数据和知识管理系统,以存储、检索和分析大量数据,支持AI Agent的学习和决策过程。

安全性和隐私保护机制

考虑到数据安全和隐私问题,Agentic Workflow内置了加密、访问控制和审计跟踪等安全机制,以保护敏感信息12。

设计模式

Agentic Workflow的设计模式包括反思、工具使用、规划和多智能体协作,这些模式指导开发者如何利用AI Agent来创建能够自主操作和适应环境变化的工作流程。

Agentic Workflow代理工作流的核心构成要素

Agentic Workflow(代理工作流)是一种通过AI Agent 来增强和优化工作流程的方法。这种工作流通常涉及将复杂的任务分解为更小的、可管理的子任务,然后由AI Agent代理逐步完成。

定义目标和需求

明确你希望通过Agentic Workflow实现的目标和需求。

选择合适的AI平台

选择一个支持Agentic Workflow的AI平台,例如LinkAI或其他提供类似功能的平台。

集成所需应用程序

确定需要集成到工作流中的应用程序和工具,并利用AI平台的集成功能将它们连接起来。

设计工作流程

设计工作流程的每个阶段,包括触发事件、任务执行、决策点和反馈循环。

创建AI代理

根据工作流程的需要,创建一个或多个AI代理来执行特定的任务或子任务。

任务分解

将复杂的任务分解为更小的步骤,确保每个步骤都可以由AI代理独立完成。

设置触发器和动作

为每个AI代理设置触发器,定义在什么条件下代理应该执行特定的动作。

迭代和优化

通过测试和反馈来迭代和优化工作流程,确保AI代理能够准确地完成任务。

监控和调整

持续监控工作流程的执行情况,并根据需要进行调整,以提高效率和准确性。

用户界面和体验

设计直观的用户界面,使用户能够轻松地与AI代理交互和管理工作流程。

安全性和合规性

确保工作流程符合相关的数据保护法规和安全标准。

文档和培训

为团队成员提供必要的文档和培训,确保他们理解并能够有效地使用Agentic Workflow。

利用反馈进行迭代

收集用户反馈,并将其用于进一步改进工作流程和AI代理的性能。

扩展和集成

随着业务需求的发展,考虑扩展工作流程并集成更多的应用程序和服务。

你可以构建一个Agentic Workflow,它能够利用AI Agent的力量来自动化复杂的任务,提高工作效率,并释放人力资源以专注于更高价值的工作。

进入实战

说了这么多,什么是Agentic AI?我们直接进入实战。

什么时候我该使用Agentic?什么时侯我该使用Agentic Workflow

哪些场景必须使用Agentic?

Agentic是用来解决AI的准确率以及让AI可以有一个自我反思,极大化唤醒LLMs的内部涌现机制的。要知道一个成熟的以百B来计的LLM内部聚合着的知识那可是超越互联网搜索引擎的,可以毫不夸张的说这样的一个LLM聚合了人类几乎所有文字上可以找到的知识。

如何利用和发挥好这些知识而不要让LLM产生的答案和你的答案出现偏移,就是关系到一个正确“引导涌现”而不要老是出现幻觉的问题。

同时对于追求高精度场景,即LLMs的回答必须精确到像“规则引擎”一样,此时你必须使用Agentic。

如:

1. 导游,你手头资料库只有杭州相关的旅游信息,用户现在在问北京,如果在RAG里没有Agentic此时LLMs有90%概率会把杭州的信息“包装”一下用以回答用户关于“北京”旅游的信息,这太可怕了。

2. 用户的问题比较模棱两可,此时一般的AI Agent上手就回答了,而实际回答的效果是很糟的。此时我们希望Agent接近人类一样,可以不断的在和用户的交互中确认、引导甚至诱导,一步步让客户把它的问题明确以便于LLMs更好、更准确的回答用户。比如说:

用户:我想喝咖啡。
AI:请问您是爱喝什么口味的咖啡呢?有无品牌要求?

用户:美式
AI:请问您爱手工调配的还是冲压?喜欢在家自己研磨吗?

用户:不在家,在家不太喝,我是上班族。
AI:那您更多的是在外面喝咖啡吧?那么您有无自己中意的咖啡品牌?星巴克?Manner还是Costa。

用户:星巴克
AI:那太好了,我们这正好有如下几款星巴克。。。。。。

Agentic一定要有Workflow吗?

不一定,单个也可以,如下魔咒所示,就是一种Agentic:

请确保文章的每一段落都能直接进入讨论主题,而不是通过引入或过渡性短语来构建内容。尤其在文章的最后一部分,直接陈述您的观点或结论,避免使用可能导致总结或过渡的词汇和短语。示例:如下
错误:首先,我们需要考虑……
正确:考虑到……
错误:这个观点很有趣,然而……
正确:尽管这个观点很有趣,……
错误:综上所述,我们可以得出结论……
正确:根据以上分析,我们可以得出结论……

它自带“反思”。

Workflow到底可以给Agentic带来什么不一样的地方?

如果只是像上述例子中的Agentic不能满足我们复杂的业务场景,比如说:多工种合作(有点像斯坦福小镇)那种。

我们用举例来说明。

自然语言数据报表处理

说我们零售有一个集采系统,这个系统可以让各门店报上各自的需求,也可以让供应商来这个系统上查看各需求同时来满足各门店的采购需求。

这种在B2b2c场景应用面特别多,而一旦当密如蛛网的B2b2c形成后,IT人员会陷入各种无陷报表的“杂事”中。于是呢,我们决定把这个Portal开放给到门店、供应商自己去做查询。但是问题是:这些用户非IT专业,他们会个Excel已经不得了,怎么可能自己去做出下钻、上钻、剖析、行列转变的SQL呢?

那么此时我们准备用自然语言向他们开放报表报务,使得这些人员通过自然语言描述就可以让AI出具相应的报表。

不过问题又来了,这些人员的语言、逻辑思维能力也是不如受过专业训练的IT人员的,比如说对于洗发水的描述就有好几种切口或者不统一的说法。

有人爱说:飘柔

有人爱说:飘柔洗发水

有人爱说:沙宣

有人爱说:那个舒淇做广告的

有人会说:黑人牙膏

有人会说:黑人

有人会说:black man

千奇百怪的说法、切口、甚至还有错别字。当一个庞大的报表系统要精准的出据报表,又要处理这些语义上的校正,这显然用一个Agentic是不可能的。此时必须使用Agentic Workflwo。

因此我们的处理步骤如下:

  1. 先判断用户当前输入的门店是什么
  2. 再判断用户当前到底是问怎么操作?如:常用操作知识或者不熟悉还是闲聊还是已经表达清了自己想要查看什么数据?亦或者说的出据报表的类别描述的太粗颗粒了?
  3. 再看用户对于报表的查询条件是否已经到达了可以出据报表的程度?
  4. 出据报表

再来举一例。

智能导游

我们可以看到现市面上的导游基本都是不管你是谁上去看到的“套餐”都为预设式。可是很多时候我们的客户的需求千奇百怪。或许网站上提供的130种套餐都不符合我的真正心意,我希望在A套餐里抽出3条+B套餐内的1条+D套餐内的饮食安排?

这种需求你怎么满足?

同时呢,用户可能不仅仅只是要求你出据旅游计划、策划,而是正在问你当地的名胜古迹的一些历史背景呢?

此时我们的解决手法是,2套每套又蕴含多Agentic Workflow。

第一套:先判断用户当前是在咨询非旅游策划类即:普通咨询,如:一些景点的收费情况呀?名胜古迹背后的历史故事呀?风土人情呀?还是专业旅游路线策划类咨询:即计划类、策划类咨询。

第二套:有了第一套判断后此时AI会把用户的后续咨询事宜交给不同的“专家座席”,比如说我们现在知道了用户正在做“专业旅游路线策划”,那么当专业旅游路线策划AI Agentic接手后它会进入正式回答。

可是我们从业务知识知道,当一个旅游策划类AI需要精准得回答出让用户满意的答案时必须要知道几个基础信息,无非就是:

  1. 你游玩的目的地(当然这个目的地还要我们支持,你不能说你要去月亮,如果没有Agentic那AI还真会给你胡诌一通);
  2. 你的游玩意图,即:是美食为主?步行为主?自由行?跟团?信仰之游?还是只看景点?还是去享受人生的?
  3. 你准备好去几天?
  4. 你是否有什么其它特殊要求?

所以这一个Agentic就蕴含了至少3-4道Workflow的Step,如下图所示:

说在最后

Agentic AI 的出现是人工智能领域的一场重大变革,它将从根本上改变我们与 AI 的交互方式,也将为人类社会带来巨大的价值。

我们共同呼吁开发者积极拥抱 Agentic AI,探索其应用边界,共同推动 AI 技术的发展。同时,我们要高度关注 Agentic AI 可能带来的伦理和社会影响,例如算法偏见、隐私泄露等问题,各界需要共同努力,确保 AI 技术安全可控地发展,为人类创造更加美好的未来。

  • 4
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

TGITCIC

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值