一文剖析大模型、RAG、Agent、MCP、Function Calling、知识库、向量数据库、知识图谱、AGI 的区别和联系

最新推荐文章于 2025-05-17 16:00:52 发布

大模型大模型

最新推荐文章于 2025-05-17 16:00:52 发布

阅读量1k

点赞数 20

文章标签：数据库知识图谱 agi 深度学习机器学习大模型人工智能

本文链接：https://blog.csdn.net/qq_46094651/article/details/147926243

版权

应当将 AI 大模型视作人类大脑，如此一来，调用 AI 大模型就如同调用一个人。把 AI 大模型当作人来看待，它能够理解人类语言、使用人类语言进行交流，并且会直接给出答案，然而，这些答案并非总是准确无误。

鉴于此，为了实现真正的 AGI（通用人工智能），在 AI 大模型推理的基础之上，必须借助 RAG、Agent、MCP、Function Calling、知识库、向量数据库、知识图谱等技术手段。那么，这些技术之间究竟存在怎样的区别与联系呢？本文将通过下图的横向对比展开详细分析。

1、大语言模型（LLM）

大语言模型（LLM）作为机器学习模型的重要类型，借助深度学习技术，基于海量文本数据集完成训练过程。它不仅能够生成符合人类语言习惯、流畅自然的文本内容，还具备精准解读语言文本深层语义信息的能力。在自然语言处理领域，大语言模型应用极为广泛，涵盖文本分类、智能问答、人机交互对话等众多任务，已然成为人工智能领域不可或缺的关键支撑。

过去一年间，大语言模型及其在人工智能领域的应用，引发了全球科技界的高度关注与热烈讨论。尤为突出的是，大语言模型在规模层面实现了重大突破，模型参数量从最初的数十亿量级，快速增长至如今令人瞩目的万亿量级。如此巨大的跨越，大幅提升了大语言模型捕捉人类语言细微差异的能力，使其能够更为透彻地理解人类语言复杂的内在本质。

DeepSeek V3 的发布，为我们回顾过去一年大语言模型的发展提供了契机。在这一年里，大语言模型在诸多关键领域成果斐然，比如在高效学习新知识、科学拆解复杂任务以及精准实现图文信息匹配等方面，都取得了显著进展。随着技术持续迭代优化，大语言模型的应用范围将不断拓展，未来有望为人们带来更智能、更具个性化的服务体验，进而从根本上重塑人类的生活和生产方式。

推理能力是大语言模型的核心特质，也是其支撑各类应用的根本基础。

2、检索增强生成（RAG）

RAG（Retrieval-Augmented Generation）技术是一种集成检索与生成双重能力的知识增强方案，旨在应对复杂多变的信息查询和生成挑战。在如今的大模型时代背景下，RAG 巧妙地引入外部数据源，比如：本地知识库或企业信息库，为 AI 大模型赋予了更强大的检索和生成实力，从而显著提升了信息查询和生成的品质。

RAG 技术的核心在于它将先进的向量数据库与大模型的智能问答能力进行了完美结合。知识库中的信息被精心存储在向量数据库中，当接收到用户的问题时，系统能够迅速从知识库中检索出相关的知识片段。随后，这些片段会与大模型的智慧相结合，共同孕育出精确而全面的回答。这种技术的运用极大地提高了 AI 系统在处理复杂问题时的准确性和响应速度，为用户带来了更加优质和高效的体验。

总之，RAG 技术就是给大语言模型新知识。

3、智能体（Agent）

在 AI 大模型时代，任何具备独立思考能力并能与环境进行交互的实体，都可以被抽象地描述为智能体（Agent）。这个英文词汇在 AI 领域被普遍采纳，用以指代那些能够自主活动的软件或硬件实体。在国内，我们习惯将其译为“智能体”，尽管过去也曾出现过“代理”、“代理者”或“智能主体”等译法。

智能体构建在大语言模型的推理能力基础上，对大语言模型的 Planning 规划的方案使用工具执行（Action） ,并对执行的过程进行观测（Observation）,保证任务的落地执行。

总之，Agent 智能体 = 大语言模型的推理能力 + 使用工具行动的能力。

4、MCP（Model Context Protocol）

MCP（模型上下文协议）是由 Anthropic 定义的一个开放协议，标准化应用程序如何为大语言模型（LLM）提供上下文。更具体地说，它试图标准化基于 LLM 的应用程序与其他环境集成的协议。

在 AI Agent 系统（Agentic Systems）中，上下文可以通过多种方式提供：

外部数据：这是长期记忆的一部分。
工具： 系统与环境交互的能力。
动态提示词：可以作为系统提示词（System Prompt）的一部分注入。

第一、为什么要标准化？

目前，AI Agent 应用的开发流程很混乱：

有许多 AI Agent 框架存在细微差异。虽然看到生态系统蓬勃发展令人鼓舞，但这些细微差异很少能带来足够的价值，但可能会显著改变你的代码编写方式。
与外部数据源的集成通常是临时实现的，并且使用不同的协议，即使在组织内部也是如此。对于不同公司来说，这显然是如此。
工具在代码库中以略微不同的方式定义。如何将工具附加到增强型 LLM 上也是不同的。

目标是提高我们创新 AI Agent 应用的速度、安全性以及将相关数据带入上下文的便利性。

第二、MCP 架构设计

MCP Host： 使用 LLM 为核心并希望通过 MCP 访问数据的程序。
MCP Client： 与 MCP Server 保持1:1连接的客户端。
MCP Server： 每个 MCP Server 都通过标准化的模型上下文协议公开特定功能的轻量级程序。
Local Data Sources： 你计算机上的文件、数据库和服务，MCP Server 可以安全访问。
Remote Data Sources： 通过互联网可用的外部系统（比如：通过 API），MCP Server 可以连接到这些系统。

5、Function Calling

Function Calling 是由 OpenAI 等公司推动的一种技术，它允许大语言模型（LLM）通过自然语言指令与外部工具和服务进行交互，从而将自然语言转换为具体的 API 调用。这一技术解决了大语言模型在训练完成后知识更新停滞的问题，使大模型能够获取实时信息，比如：当前的天气、股市收盘点数等。

工作原理

Function Calling 的工作原理可以通过以下4个步骤来理解：

• 识别需求： 大模型识别出用户的问题需要调用外部 API 来获取实时信息。比如：用户询问“今天北京的天气如何？”大模型会识别出这是一个关于实时天气的问题。

• 选择函数： 大模型从可用的函数库中选择合适的函数。在这个例子中，大模型会选择 get_current_weather 函数。

• 准备参数： 大模型准备调用函数所需的参数。例如：{ “location”: “北京”, “unit”: “celsius”}

• 调用函数： AI 应用使用这些参数调用实际的天气 API，获取北京的实时天气数据。

• 整合回答： 大模型将获取的数据整合成一个完整的回答，比如：“根据最新数据，北京今天的天气晴朗，当前温度23°C，湿度45%，微风。今天的最高温度预计为26°C，最低温度为18°C。”

对开发者的好处

对于开发者来说，使用 LLM 的 Function Calling 入门相对容易。开发者只需按照 API 的要求定义函数规格（通常是 JSON 格式），并将其随 Prompt 请求发送给大模型。大模型会根据需要调用这些函数，整个逻辑相当直观。因此，对于单一大模型、少量功能的简单应用，Function Calling 的实现非常直接，几乎可以“一键”将大模型输出对接到代码逻辑中。

局限性

然而，Function Calling 也有一些局限性：

• 缺乏跨大模型的一致性： 每个 LLM 供应商的接口格式略有差异，这使得开发者在支持多个大模型时需要为不同的 API 做适配，或者使用额外的框架来处理这些差异。

• 平台依赖性： Function Calling 通常依赖于特定的平台或框架，这限制了其在不同环境中的通用性。

• 扩展性有限： 虽然 Function Calling 能够解决特定问题，但在面对更复杂的任务时，其扩展性可能会受到限制。开发者可能需要为每个新功能编写新的函数，并确保这些函数与模型的交互逻辑兼容。

总结

Function Calling 是一种强大的工具，它为大语言模型提供了与外部工具和服务交互的能力，从而解决了大模型知识更新停滞的问题。然而，它的局限性在于缺乏跨模型的一致性和平台依赖性。尽管如此，Function Calling 仍然是一个重要的技术，尤其是在需要快速实现特定功能时。未来，随着技术的不断发展，我们期待看到更多能够克服这些局限性的解决方案。

6、知识库

对于企业而言，构建一个符合自身业务需求的知识库是至关重要的。通过RAG、微调等技术手段，我们可以将通用的大模型转变为对特定行业有着深度理解的“行业专家”，从而更好地服务于企业的具体业务需求。这样的知识库基本上适用于每个公司各行各业，包括：市场调研知识库、人力资源知识库、项目管理知识库、技术文档知识库、项目流程知识库、招标投标知识库等等。

知识库的技术架构分为两部分：

离线的知识数据向量化

• 加载： 通过文档加载器（Document Loaders）加载数据/知识库。

• 拆分： 文本拆分器将大型文档拆分为较小的块。便于向量或和后续检索。

• 向量： 对拆分的数据块，进行 Embedding 向量化处理。

• 存储： 将向量化的数据块存储到向量数据库 VectorDB 中，方便进行搜索。

在线的知识检索返回

• 检索： 根据用户输入，使用检索器从存储中检索相关的 Chunk。

• 生成： 使用包含问题和检索到的知识提示词，交给大语言模型生成答案。

总之，知识库是 AI 大模型应用的知识基础。

7、向量数据库

向量数据库是专注于存储和查询向量的系统，其向量源于文本、语音、图像等数据的向量化表示。

相较于传统数据库，向量数据库更擅长处理非结构化数据，比如：文本、图像和音频。在机器学习和深度学习中，数据通常以向量形式存在。

向量数据库凭借高效存储、索引和搜索高维数据点的能力，在处理比如：数值特征、文本或图像嵌入等复杂数据时表现出色。

总之，知识库的存储载体往往是向量数据库，另外在数据存储和检索上，向量数据库以向量空间模型高效存储和检索高维数据，为 AI 大模型和 Agent 智能体提供强有力的数据支持。

8、知识图谱

知识图谱是一种基于实体和关系的图结构数据库，旨在表示和管理知识。它采用结构化数据模型来存储、管理和显示人类语言知识。

知识图谱通过语义抽取建立人类语言知识间的关系，形成树状结构。实体如人、地点、组织等，具有特定属性和关系，这些关系连接着不同的实体。通过数据挖掘、信息处理和图形绘制，知识图谱揭示了知识领域的动态发展规律，为学科研究提供了有价值的参考。

医疗领域是知识图谱技术的一个广泛应用场景，它可以帮助临床诊疗、医疗数据的整合与利用，并通过实体识别、关系抽取和数据集训练，以图谱形式展示关键节点和它们之间的联系，从而支持更精准的医疗决策。

与此同时，在智能推荐、自然语言处理、机器学习等领域也具有广泛的应用。尤其在搜索引擎领域，它能够提高搜索的准确性，为用户提供更加精准的搜索结果。

总之，知识图谱本质上是一种叫作语义网络的知识库，即一个具有有向图结构的知识库，其中图的结点代表实体或者概念，而图的边代表实体/概念之间的各种语义关系。

9、AGI

AGI（通用人工智能）作为 AI 发展的终极愿景，追求的是让智能系统具备像人类一样理解和处理各种复杂情况与任务的能力。在实现这一宏伟目标的过程中，AI 大模型、Prompt Engineering、Agent 智能体、知识库、向量数据库、RAG 以及知识图谱等技术扮演着至关重要的角色。这些技术元素在多样化的形态中相互协作，共同推动 AI 技术持续向前发展，为实现 AGI 的最终目标奠定坚实基础。

那么，如何系统的去学习大模型LLM？

作为一名从业五年的资深大模型算法工程师，我经常会收到一些评论和私信，我是小白，学习大模型该从哪里入手呢？我自学没有方向怎么办？这个地方我不会啊。如果你也有类似的经历，一定要继续看下去！这些问题啊，也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点，给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢，我就曾放空大脑，以一个大模型小白的角度去重新解析它，采用基础知识和实战项目相结合的教学方式，历时3个月，终于完成了这样的课程，让你真正体会到什么是每一秒都在疯狂输出知识点。

由于篇幅有限，⚡️ 朋友们如果有需要全套《2025全新制作的大模型全套资料》，扫码获取~
在这里插入图片描述

👉大模型学习指南+路线汇总👈

我们这套大模型资料呢，会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
在这里插入图片描述

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程，带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念，用最易懂的方式带你入门大模型。
在这里插入图片描述

👉②.进阶篇👈

接下来是进阶篇，你将掌握RAG、Agent、Langchain、大模型微调和私有化部署，学习如何构建外挂知识库并和自己的企业相结合，学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
在这里插入图片描述

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目（已脱敏），比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等，从而帮助大家更好的应对大模型时代的挑战。
在这里插入图片描述

👉④.福利篇👈

最后呢，会给大家一个小福利，课程视频中的所有素材，有搭建AI开发环境资料包，还有学习计划表，几十上百G素材、电子书和课件等等，只要你能想到的素材，我这里几乎都有。我已经全部上传到CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
在这里插入图片描述
相信我，这套大模型系统教程将会是全网最齐全最易懂的小白专用课！！