AI智能体:如何打造数字员工

人工智能代理的崛起正在重塑我们构建和思考软件的方式。我们不再只是编写代码并指示计算机做什么,而是正在教它们如何思考。

人工智能代理是一种构建智能系统的新方法。它们利用大型语言模型(LLMs)将自动化和认知能力结合到工具中,这些工具不仅遵循命令,还能够推理、做决策、采取行动,甚至随着时间的推移进行学习。

多步骤工作流程——Hebbia.ai

我一直在尝试使用各种框架来理解代理的工作原理以及它们的可能性。在这篇文章中,我将分享与代理合作的主要学习成果和想法,以及它们为何代表着我们与技术互动方式的根本转变。

什么是代理?

与遵循固定指令集的传统程序不同,代理是一种新型软件,使用LLMs和智能来弄清楚需要做什么,如何去做,然后独立完成这一切。

如果这听起来有点抽象,这里是该领域的领导者们的解释:

LangChain:“一个使用LLM来决定应用程序控制流的系统。”

NVIDIA:“一个能够使用LLM来推理问题,制定解决问题的计划,并借助一组工具执行该计划的系统。”

AWS:“一个可以与环境互动,收集数据并使用数据来执行自我决定的任务以达到预定目标的软件程序。”

Andrew Ng:见此处

无论是帮助用户规划旅行,自动化工作流程,还是回答问题,代理在使软件更加高效和有用方面都取得了巨大的进步。

我们是如何进入代理时代的?

LLMs已经从仅仅生成文本和推理扩展到了做更多事情。现在,它们可以与其他LLMs协同工作(例如,编排),执行现实世界的操作(例如,调用工具API),并且可以长时间保持上下文(例如,更大的上下文窗口)。

因此,LLMs正在从被动的响应者转变为智能系统,可以承担传统上为人类保留的角色,从客户服务和招聘到复杂的行业如法律和建筑。

在这里插入图片描述

AI催化了一个长久以来的承诺——Felicis
代理的解剖结构
要了解代理是如何工作的以及为什么它们如此强大,让我们来探讨它们的核心组件:

在这里插入图片描述

1、感知
代理需要从用户或环境中获取输入。输入可以是聊天文本,语音通话,图像或API调用,任何与代理互动的数据。这些数据对于代理理解其周围环境和上下文至关重要。

例如:一位航空旅行代理通过聊天界面处理用户请求。从“预订10月5日至10日往返纽约的航班”中,它提取关键细节如日期,目的地和偏好,以有效指导搜索…

2、大脑

作为AI代理的“大脑”——LLMs——负责推理、计划和适应。

推理涉及分析输入,分解复杂任务并生成潜在解决方案。
计划使代理能够按时间顺序安排操作,确保任务高效完成。
适应性使代理能够应对动态环境(例如对话)或不断变化的信息。
例如:…在捕获航班请求后,代理识别出寻找出发和返回航班的任务,并定义了基于用户偏好的步骤和操作,以帮助客户预订航班…

3. 记忆

AI代理的记忆有两种形式:短期记忆是基于会话的,依赖于LLM的上下文窗口来跟踪最近的互动并确保连贯的响应。而长期记忆通常存储在外部数据库中,允许代理访问和交叉参考过去对话或用户偏好。

例如:…旅行代理在会话期间跟踪当前选择的日期和等级,同时使用长期记忆来回忆过去的偏好,如首选航空公司或常旅客详情…

4. 知识

除了记忆,代理还可以参考特定于公司的知识库,例如常见问题,文件或标准操作程序。这些知识通常存储在文档和向量数据库中,并用于提高推理和决策能力。

例如:…客户向旅行代理咨询行李政策和升级选项时,代理会检索特定公司的政策以确保正确解决这些用户查询…

5. 行动

工具是让代理真正强大的因素。LLMs可以决定何时以及如何使用工具,如API查询额外数据,更新系统或执行现实世界操作。这种能够在正确的时间动态选择正确工具的能力使得代理能够灵活高效地运行,并无缝集成到现有系统中以提供结果。

例如:…代理可以调用航空公司的API以实时获取航班选项、价格和座位可用性。一旦用户批准,它会调用API完成预订,并通过电子邮件发送详细的行程表。

设计代理
设计有效的AI代理就像招聘和培训新员工一样:我们需要认识到我们在创造工人。

通过定义代理的角色、职责、工具、互动和学习路径,我们确保它能够高效运行并符合组织目标。

构建AI代理团队——Relevance.ai
以下是设计代理的每个步骤如何与招聘相呼应:

定义代理的人格和目标
代理必须有人格和目标——它要解决的问题和存在的原因。这是它的“职位描述”。它是客户服务代理还是数据研究员?代理要解决什么问题?它的用户是谁?成功是什么样的?

提示:将人格与可衡量的结果联系起来,并定期重新审视,以确保其随着业务需求的变化而演变。

2. 列出任务和计划

接下来,定义代理的任务和工作流程。代理需要做什么以及如何做:剧本或常规。定义逐步流程是迭代最多的部分,定义关键任务是什么?可能出现哪些边缘情况?它必须遵循哪些规则?

提示:在复杂性和一致性之间找到平衡:流程或任务越多,代理失败的可能性越大。

以下是Google代理中目标和指令如何定义的示例:

在这里插入图片描述

使用剧本构建代理——Google
3. 定义记忆

记忆使代理保持一致并学习。短期记忆跟踪最近的互动,而长期记忆将历史细节存储在外部数据库中:会话期间应保留哪些信息?哪些数据需要长期保存?

提示:从定义最有价值的数据开始,如频繁访问的客户详情,并逐步构建记忆系统,确保可扩展性,同时不过度负担代理。

在这里插入图片描述

启动长期记忆支持——LangGraph
4. 配备知识

类似于员工需要访问手册或公司文档,代理需要访问FAQ或产品目录以提供准确的响应。代理需要哪些知识来源?如何保持这些知识更新?哪种格式确保易于检索?

提示:使用向量数据库或RAG技术,并安排更新以确保知识保持相关性。

5. 配备工具

工具对于代理来说就像软件和系统对于员工一样——它们使行动成为可能。代理通过调用API查询数据、更新记录或预订会议。需要哪些API?它们可用还是需要开发?哪些权限确保安全使用?

提示:定义特定目的的工具并实施基于角色的权限,就像给员工正确的软件和访问级别以高效和安全地完成工作一样。

请记住,LLMs决定何时以及如何调用这些API,因此在任务定义中迭代和包含这些工具很重要。以下是OpenAI如何定义LLMs调用工具的方式:

在这里插入图片描述

功能调用——OpenAI
设计代理团队
复杂的问题很少能由一个人单独解决,代理也一样。与其构建一个大型全能的代理,不如让一组专业代理协同工作,更有效地处理任务。

例如,一个代理可能收集数据,另一个可能分析数据,第三个可能生成解决方案,第四个可能完善这些解决方案。这些代理协作工作,根据需要相互传递任务,就像团队中的同事一样。

随着复杂性的增加,管理和扩展代理变得更加具有挑战性。常见问题包括代理拥有太多工具并做出糟糕的决策选择使用哪个工具,难以管理过于复杂的上下文,或者需要像规划者、研究人员或数学专家这样的专门角色来处理特定任务。

这种模块化、“多思维”方法减少了复杂性并确保了可靠性。代理还可以将自己无法处理的任务委托给其他人,通过保持单个代理专注于较小的范围来提高整体性能。

通过构建协作代理网络,您实际上是在构建一个能够像一组技能熟练的员工一起处理复杂项目的AI劳动力——就像团队一起应对具有挑战性的项目一样。

多代理系统——LangChain
超越POC:部署代理
迭代
构建有效的代理本质上是迭代的。第一个版本从来不是最终版本。现实世界条件揭示了在开发过程中不明显的边界情况、隐藏假设和新的可能性。

员工通过反馈、审查和在职经验成长——代理也不例外。通过收集反馈,如用户评分或错误日志,并融入更新,代理会随着时间的推移不断改进其行为和性能。

AI代理通过从僵化规则转向动态、推理驱动的系统来革新自动化。它们的自主性非常强大,但也带来了信任、安全和运营监督方面的挑战。

更多考虑事项:安全、运营等
AI代理正在改变自动化,但部署它们也带来了挑战。例如,扩展团队或初创公司时面临的相同挑战:

安全性必须是基础——就像员工一样,代理需要单点登录、基于角色的权限和凭据管理等保护措施,以确保它们仅访问必要的内容。护栏、日志、审计和凭据轮换对于维护合规性、保护敏感数据和建立信任至关重要。

运营同样重要。正如首席运营官跟踪和优化工作流程一样,代理需要工具来确保它们随着时间的推移保持有效、可靠和适应性。

我们正处于技术构建方式转变的早期阶段。AI代理不仅仅是用于自动化的工具——它们是数字合作者。

最后分享

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。

学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。

这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。
在这里插入图片描述

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

在这里插入图片描述

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

在这里插入图片描述

4. 2024行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

在这里插入图片描述

5. 大模型项目实战

学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

在这里插入图片描述

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

在这里插入图片描述

全套的AI大模型学习资源已经整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费

为了在Windows安装ADB工具,你可以按照以下步骤进行操作: 1. 首先,下载ADB工具包并解压缩到你自定义的安装目录。你可以选择将其解压缩到任何你喜欢的位置。 2. 打开运行窗口,可以通过按下Win+R键来快速打开。在运行窗口中输入"sysdm.cpl"并按下回车键。 3. 在系统属性窗口中,选择"高级"选项卡,然后点击"环境变量"按钮。 4. 在环境变量窗口中,选择"系统变量"部分,并找到名为"Path"的变量。点击"编辑"按钮。 5. 在编辑环境变量窗口中,点击"新建"按钮,并将ADB工具的安装路径添加到新建的路径中。确保路径正确无误后,点击"确定"按钮。 6. 返回到桌面,打开命令提示符窗口。你可以通过按下Win+R键,然后输入"cmd"并按下回车键来快速打开命令提示符窗口。 7. 在命令提示符窗口中,输入"adb version"命令来验证ADB工具是否成功安装。如果显示版本信息,则表示安装成功。 这样,你就成功在Windows安装ADB工具。你可以使用ADB工具来执行各种操作,如枚举设备、进入/退出ADB终端、文件传输、运行命令、查看系统日志等。具体的操作方法可以参考ADB工具的官方文档或其他相关教程。\[1\]\[2\]\[3\] #### 引用[.reference_title] - *1* [windows环境安装adb驱动](https://blog.csdn.net/zx54633089/article/details/128533343)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [Windows安装使用ADB简单易懂教程](https://blog.csdn.net/m0_37777700/article/details/129836351)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值