在当今快节奏的商业环境中,企业一直在寻找提高效率、超越竞争对手和提供卓越客户体验的方法。检索增强生成 (RAG) 作为一项将信息检索能力与 AI 生成能力相结合的强大技术,正在成为游戏规则的改变者。这项创新技术为企业带来了诸多优势,可以彻底改变他们的运营方式。
其中一个最引人注目的应用领域是客户支持。想象一下,聊天机器人和虚拟助手能够利用公司整个知识库或过去的客户互动来提供更准确、更有针对性的响应。RAG 使这一切成为可能,从而缩短了解决问题的时间,提高了客户满意度,并减轻了人工支持团队的负担。
但这还不是全部。RAG 还擅长简化知识管理。企业经常发现自己淹没在存储在文档、电子邮件和报告中的海量非结构化数据中。RAG 通过允许用户快速检索所需信息来应对这一挑战。员工可以轻松找到内部查询的答案,访问相关文档以进行决策,并更有效地开展研究,最终提高整体生产力。
而且,RAG 的功能远远超出了简单的信息检索和生成。它还可以在数据分析中发挥关键作用。通过从大型数据集中识别相关数据点和见解,RAG 可以自动化部分数据分析流程,从而更快地获得可操作的见解。这使企业能够以更快的速度和更高的准确性做出数据驱动的决策。
准备好亲身体验 RAG 的强大功能了吗?
在这篇博文中,我们将引导您完成使用 AgentCloud 和 MongoDB 在几分钟内构建 RAG 聊天机器人的分步过程。不要担心,即使你不是技术专家,我们也会让您轻松上手。
AgentCloud:您通往复杂 LLM 应用程序的大门
AgentCloud 是一个开源平台,使公司能够构建和部署私人 LLM 聊天应用程序,使团队能够安全地与其数据交互。该平台利用 Airbyte 建立数据管道,允许从 MongoDB 等 NoSQL 数据库等 300 多个数据源中提取、分块和嵌入数据。这种无缝集成简化了将数据导入向量存储以进行初始设置和后续计划更新的过程,确保向量存储信息始终保持最新。
AgentCloud 使用 Qdrant 作为其向量存储,以高效存储和管理大量向量嵌入。当用户提交查询时,RAG 应用程序会分析其向量表示与存储在 Qdrant 中的查询向量的相似程度,从而检索最相关的文档。
让我们深入了解实际操作并使用 Docker 设置 Agent Cloud。
首先,确保您的系统上安装了 Docker。然后,您可以按照以下步骤操作以启动并运行 AgentCloud:
-
克隆存储库:
bashgit clone https://github.com/rnadigital/agentcloud.git
-
导航到 agentcloud 目录:
bashcd agentcloud
-
使用以下命令在本地运行:
bashchmod +x install.sh && ./install.sh
此安装脚本将下载所有必需的 Docker 镜像,并在 Docker 中启动容器,从而简化设置过程。
设置您的本地 Agent Cloud 环境
安装脚本成功执行后,您可以通过导航到以下 URL 在浏览器中访问 Agent Cloud:http://localhost:3000/register。
您需要做的第一件事是创建一个帐户并登录到平台。登录后,您将进入主仪表板。
为您的 RAG 应用程序提供动力:添加新模型
AgentCloud 支持广泛的模型,包括 FastEmbed 和 OpenAI,让您可以灵活地为您的应用程序选择最佳模型。
要添加新模型,请转到“模型”屏幕,然后单击“添加模型”选项。您将看到一个配置屏幕,您可以在其中选择所需的模型。对于本教程,我们将使用 fast-bge-small-en
模型,该模型以其在嵌入文本内容方面的效率而闻名。
选择一个高效的嵌入模型:FastEmbed
FastEmbed 是一个轻量级库,依赖性极小,非常适合 AWS Lambda 等无服务器环境。核心模型 fast-bge-small-en
体积小巧,能够高效捕获文本含义,用于分类和检索等任务。这种组合为开发人员提供了在无服务器部署中进行实时文本分析的强大解决方案。
连接到您的数据:创建数据源
在本教程中,我们将使用 MongoDB 作为我们的数据源。MongoDB 是一种流行的 NoSQL 数据库,以其灵活性和可扩展性而闻名,使其成为 RAG 应用程序的绝佳选择。
假设您在 MongoDB 中有一个名为 course_db
的数据库,其中包含一个名为 course_catalog
的集合。此集合存储有关不同课程的信息,包括标题、描述、级别、持续时间、涵盖的技能、URL 和元数据。
为了访问和利用 RAG 中的 MongoDB 数据,我们需要创建一个 MongoDB 数据源。在 AgentCloud 中,转到“数据源”页面,然后单击“新建连接”按钮。从可用选项列表中选择 MongoDB。
为您的数据源指定一个描述性名称(例如 course_db_mongo
),并将其“计划类型”保留为“手动”。这意味着 MongoDB 数据将手动同步到向量存储。
接下来,提供您的 MongoDB 连接详细信息,包括连接字符串和数据库名称。由于我们是在本地机器上使用 Docker 运行 MongoDB,因此请选择“自管理副本集”作为集群类型。其余设置可以保留其默认值。
现在是时候选择要同步的集合了。选择 course_catalog
集合,并选择所有字段以同步到向量存储。
在发布数据源之前,您需要选择要嵌入的字段。Mongo meta_data
字段包含所有相关信息,因此请选择此字段进行嵌入。
恭喜!您已成功创建了一个 MongoDB 数据源。在第一次运行时,它会将您的 Mongo 数据嵌入并存储在 Qdrant 向量存储中。
增强您的代理能力:设置工具www.cqzlsb.com
在 AgentCloud 中,工具使 AI 代理能够有效地与其环境交互、处理信息并采取适当的行动来实现其目标。这些工具可以包括函数、API、数据源和其他资源,这些资源可以帮助代理自主高效地执行特定任务。
我们将设置一个工具,负责查询数据源并检索相关文档。每当您添加新的数据源时,AgentCloud 默认都会创建一个工具。
创建您的 AI 代理:您问题的解决者
AI 代理是利用 LLM 技术来推理问题、制定解决这些问题的计划并在各种工具的帮助下执行这些计划的复杂系统。这些代理的特点是具有复杂的推理能力、记忆功能和自主执行任务的能力。
要创建代理,请转到“代理”页面,然后单击“新建代理”按钮。在代理配置页面中,为您的代理指定一个名称,并定义其角色、目标和背景故事。您还可以选择“模型”和“函数调用模型”,在本例中,我们将同时选择 Open AI GPT 4。
在“工具”部分,选择 course_db_mongo
工具,以使您的代理能够访问和查询 MongoDB 数据源。
如果您尚未配置 Open AI GPT 4 模型,请不要担心!您可以通过单击“模型”选项轻松添加。这将打开一个模式,您可以在其中指定模型名称、类型、凭据(您的 OpenAI API 密钥)和 LLM 模型。保存您的配置,您的 Open AI GPT 4 模型就可以使用了。
将所有内容整合在一起:创建任务
任务是分配给代理完成的特定工作单元。要创建新任务,请转到“任务”屏幕,然后单击“添加任务”按钮。
在任务配置页面中,为您的任务指定一个描述性名称并提供简要说明。选择 course_db_mongo
工具和 Course Information Agent
作为此任务的首选代理。
构建您的对话式 RAG 应用程序
现在,让我们将所有内容整合在一起,并创建一个对话式 RAG 应用程序,该应用程序将利用我们之前创建的代理和任务。此应用程序将允许用户询问有关课程的信息,我们的 AI 代理将提供准确和相关的答案。
在 AgentCloud 中,转到“应用程序”页面,然后单击“新建应用程序”按钮。在应用程序配置中,选择“对话聊天应用程序”作为“应用程序类型”。
接下来,选择我们之前创建的“课程信息任务”和“课程信息代理”。由于我们希望应用程序按顺序处理任务,因此请选择“顺序”作为流程。最后,选择 OpenAI GPT 4 作为 LLM 模型。保存您的配置,您的对话式 RAG 应用程序就可以使用了。
测试您的 RAG 聊天机器人
现在是时候测试我们新构建的 RAG 聊天机器人并见证其行动了。在 AgentCloud 中,单击应用程序旁边的“播放”按钮,这将打开一个聊天窗口。
您可以通过询问各种问题来试验聊天机器人,例如“列表中是否有任何 Python 课程?”或“您能否推荐一些针对初学者的 Google Workspace 课程?”。观察聊天机器人如何利用其知识库提供准确和信息丰富的响应。
结论
恭喜!您已成功使用 AgentCloud 和 MongoDB 构建了一个功能强大的 RAG 聊天机器人。此分步指南向您展示了 RAG 的强大功能,以及如何彻底改变企业与其数据交互的方式。
随着您继续探索 AgentCloud 和 RAG 的功能,您会发现更多增强客户支持、简化知识管理和自动化数据分析流程的方法。可能性是无限的,这仅仅是使用 AI 增强运营的旅程的开始。