AI智能体的五个级别_智能体等级划分-CSDN博客

本文链接：https://blog.csdn.net/lvaolan/article/details/140794564

介绍

这是我非常喜欢研究的一个话题。主要是因为我想揭开智能体相关概念的神秘面纱，以及智能体究竟是什么。

此外，我还想在特定领域的实现与广泛、通用的实现（即 AGI）之间建立明确的界限。

考虑到特定领域的实现，这是我最感兴趣的领域，这一类需要考虑可用的构建工具、成本、延迟以及实际和商业影响。所有这些，我都将在本文中一一阐述。

领域考虑因素

关于 AGI 或人工超级智能 (ASI) 以及各组织正在开发的产品，已经有很多炒作、恐惧和猜测。这不是我最感兴趣的，我最感兴趣的是如何利用 LLM 和自主AI智能体的力量，在组织中实现特定领域的应用。

对话式用户界面的主要商业驱动力是银行、零售、金融服务等行业的公司，它们创建了基于人工智能的用户界面，供用户就产品和服务进行交互。

任何能够感知环境并执行行动的实体都可以被视为智能体。

目前所处的阶段

考虑到细分领域的实现，我们目前处于第 2 级和第 3 级；最有可能处于 2.5 级。

LangChain 在创建智能体开发框架方面一直处于领先地位。DSPy 使用其智能体 RAG 方法对 LLM 和 LLamaIndex 进行编程。

这些智能体拥有 50% 至 90% 的成人技能，具有战略任务自动化能力。根据用户输入，智能体可以分解用户描述，规划子任务，并以有序的方式执行这些任务，从而得出结论。

这些智能体能够反复执行中间的子任务，直到得出最终答案。

实际案例

考虑以下问题？

谁被认为是 iPhone 之父，他出生年份的平方根是多少？

这是一个相当模糊和复杂的问题，需要经过几个步骤才能得出答案。不仅要完成数学任务，还要检索知识来回答问题。

在这个实际例子中，智能体可以采取以下几种行动：

LLM Math
SerpApi:下面是SerpApi网站的截图。SerpApi 使从搜索引擎结果中提取数据变得可操作。
GPT-4（gpt-4-0314）

下面，请看这个基于 LangChain 的智能体的输出，注意该智能体是如何从思考到行动，再到观察，依次进行，直到得出最终答案，完成整个链条：

在5个等级的智能体表格中，你会注意到 1 级智能体是基于规则的…基于规则的智能体可以有一定的自主性，但在实践中，它们由预定义的步骤组成，这些步骤根据预定义的步骤执行。

下图展示了一种更基于规则的方法，即使用生成式人工智能节点来构建智能体。在本文稍后部分，我将深入探讨为什么基于规则的自动化和一定程度的自主性是企业实施的明智方法。而不是完全自主的智能体方法。

细分领域智能体的基本结构

细分领域智能体的核心是大型语言模型（LLM）。智能体还可以使用一些工具。工具可以具有特定功能，如网络搜索、特定 API、RAG、数学等。

工具用自然语言描述，以便智能体知道在流程的特定阶段使用哪种工具。工具的数量和能力决定了智能体的强大程度。

实际考虑因素

在考虑细分领域的智能体实施时，有一些实际考虑因素需要牢记。

感知

目前，大多数智能体都是虚拟的，通过语音或文本输入进行访问。这些智能体可以进行推理并得出结论，然后反过来用语音或文字做出回应。可以添加多模态元素，让智能体接收图像或视频作为输入，或生成图像或视频作为输出。

不过，一般来说，机器人不具备其他感官能力，如视觉、触觉、运动等。随着机器人技术的发展，将智能体与感官/物理能力相结合将开创一个新时代。

LLM

正如我前面提到的，智能体的核心是一个 LLM，或者更具体地说是一个被调用的 LLM API。智能体会经历多次迭代和 API 调用。需要满足一个单一的依赖关系，因此我认为任何生产智能体的实现冗余都必须构建到智能体核心中。

自托管

LLM 或本地推理服务器是确保正常运行时间的最佳方式。

成本

考虑到向智能体提出的每个问题都要多次查询 LLM，使用商业 LLM API 的成本将非常高昂。

试想一下，成千上万的用户只会加剧成本问题。

延迟

对话系统需要亚秒级的响应，任何复杂的系统（如每次对话都需要在内部执行多个步骤的智能体）都会增加用户体验的总延迟。这可能成为一个难以克服的挑战。

无法得出结论

值得注意的是，目前存在智能体未得出结论或过早得出结论的情况。如果用户可以访问并查看智能体的推理步骤，那么用户的查询可能会通过智能体推理的中间步骤得到满足。在这种情况下，用户可以让智能体停止推理，并告知智能体已经提供了足够的信息。

工具与成本

智能体需要使用工具才能完成任务。可以建立一个共享工具的市场。制作者无需从头开始制作工具，只需选择现有的工具即可。

这些工具可以是免费的，也可以是收费的；工具可以访问收费的应用程序接口。

智能体一词

随着人工智能的发展，"智能体 "一词被用来描述那些表现出智能行为并拥有以下能力的实体：

自主性
反应性
主动性
社会互动等能力

20 世纪 50 年代，艾伦-图灵提出了人工智能领域的一个重要概念–图灵测试，旨在研究机器是否能表现出与人类类似的智能行为。这些人工智能实体通常被称为智能体，是人工智能系统的基础组成部分。

迁移学习

迁移学习涉及利用从一项任务中获得的知识，并将其应用到另一项任务中。

基础模型通常采用这种方法，即首先在相关任务中对模型进行训练，然后针对感兴趣的特定下游任务对模型进行微调。

迁移学习是一个强大的概念，它增加了模型的多功能性，可以根据过去的学习执行从未见过的任务。

结论

不知何故，自主AI智能体目前被忽视了，但它代表着技术的关键进步。

配备人工智能的智能体具有yi’xia以下能力：

独立运行
做出决定
在没有人类持续干预的情况下采取行动

未来，自主AI智能体将彻底改变从医疗保健、金融到制造和运输等各个行业。

然而，在决策过程中还需要考虑问责制、透明度、道德、责任和偏见等问题。

尽管存在这些挑战，自主AI智能体的未来仍大有可为。随着技术的不断发展，这些智能体将越来越多地融入我们的日常生活。

读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型！

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

👉AI大模型学习路线汇总👈

大模型学习路线图，整体分为7个大的阶段：（全套教程文末领取哈）

第一阶段： 从大模型系统设计入手，讲解大模型的主要方法；

第二阶段： 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段： 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段： 大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段： 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段： 以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段： 以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频，看书籍和视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。
在这里插入图片描述

👉学会后的收获：👈

• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求： 大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能， 学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力： 大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

👉获取方式：

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓