技术动态 | 如何使用知识图谱改进RAG？

最新推荐文章于 2025-05-30 08:05:08 发布

开放知识图谱

最新推荐文章于 2025-05-30 08:05:08 发布

阅读量209

点赞数

文章标签：知识图谱人工智能

版权

转载公众号 | 知识图谱科技

在我们关于用于知识管理的 AI 系列的这一部分中，您将了解知识图谱如何改进检索增强生成（RAG）以在公司中进行信息检索。

高级 RAG 流程

介绍

在用于公司知识管理的 AI 系统中，检索增强生成（RAG）是一种流行的架构，可以克服大型语言模型（LLM）的一些限制。

但是，RAG 存在局限性，包括难以处理结构化和非结构化公司数据的混合。解决这些限制的一种方法是将 RAG 与知识图谱（KG）相结合。

在本文中，我们将解释 Graph RAG （GRAG）如何通过使用知识图谱来提供更准确和上下文更丰富的答案，从而增强传统的RAG方法。

这不要与其他（互补）方法混淆，其中 LLM 用于提取结构化信息以构建知识图谱（也称为“Graph RAG”），例如在 Microsoft 最近的库中。

该帖子由五个主题组成：

1. 回顾：LLM 的局限性和 RAG 简介

2. 问题：传统 RAG 的局限性

3. 科普：什么是知识图谱？

4.解决方案：GRAG 简介

5.深入探讨：了解 GRAG 流程

6. 影响：GRAG 的性能影响

1. 回顾：LLM 的局限性和 RAG 简介

大型语言模型（LLM）, 如 Llama 或 Gemini 根据广泛的训练数据生成文本。尽管 LLM 的功能令人印象深刻，但它们在企业知识检索方面存在一些限制：

无法访问私人信息：LLM 接受过公开可用数据的培训，因此他们缺乏特定于公司的私人知识。

1. 幻觉: 众所周知，LLM 经常产生合理但完全错误的反应，称为 “幻觉”。

2. 静态知识: LLM 的知识是静态的，仅限于他们最近培训中包含的数据。

这意味着 LLM 在生成文本方面非常出色，但在知识管理方面却很糟糕。进入 Retrieval Augmented Generation （RAG）。

Simple RAG

检索增强生成（RAG）是一种将外部数据源与LLM（大型语言模型）结合的AI架构。其工作分为两步：

1. 检索：使用用户查询从数据库（例如公司知识库）中检索相关信息（“上下文”）。

2. 生成：根据检索到的上下文指示LLM回答用户的查询。

通过为 LLM 提供上下文作为参考，RAG 解决了前面提到的限制。有关基本 RAG 的工作原理以及它如何与 LLM 配合使用的更多背景信息，请查看我们之前的介绍性文章或 AppliedAI 的这篇详细摘要。

尽管 RAG 具有优势和受欢迎程度，但在应用于知识管理时仍然存在局限性。这些限制与特定公司数据的上下文检索有关：

使用通用模型进行检索不佳: 检索模型（嵌入编码器）通常在 Internet 数据上进行训练，因此它们可能很难在特定领域的公司知识中找到正确的上下文。
拼写错误与非拼写错误的处理: 嵌入编码器通常可以容忍拼写错误。这对于一般查询（例如，搜索 “curiosty” 与 “curiosity”）很有帮助，但对于特定于上下文的查询可能会有问题，例如，“Airbus A320” 与 “Airbus A330”。

向 LLM 提供不正确的上下文可能会用错误或捏造的事实来污染答案。提供看似合理的答案但信息不正确可能会削弱用户对系统的信心，甚至更糟糕的是，会导致现实世界中的错误。

其中一些问题可以通过提示模板来解决，这些模板指示 LLM 忽略不相关的信息，但这只能到此程度才能改善结果。

知识图谱 RAG （GRAG）是解决公司数据这些限制的一种令人兴奋的方法。