GraphRAG：知识图谱+大模型 LangChain实现

最新推荐文章于 2025-04-24 10:54:16 发布

Finger_ebic

最新推荐文章于 2025-04-24 10:54:16 发布

阅读量2.8w

点赞数 44

文章标签：知识图谱 langchain 人工智能

本文链接：https://blog.csdn.net/KQe397773106/article/details/138051927

版权

本文介绍了如何通过构建知识图谱和利用大型语言模型（LLM）增强RAG应用的准确性。重点讲解了使用Neo4j图数据库、LLMGraphTransformer和混合检索方法，包括图数据库中的知识图谱构建、混合搜索策略及其实战示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文整理自Enhancing RAG-based application accuracy by constructing and leveraging knowledge graphs一文。LangChain已经将图构建模块的首个版本集成到了其生态之中，今天本文将展示基于知识图谱的RAG应用实战

图检索增强生成（Graph RAG）正逐渐流行起来，成为传统向量搜索方法的有力补充。这种方法利用图数据库的结构化特性，将数据以节点和关系的形式组织起来，从而增强检索信息的深度和上下文关联性。

示例知识图谱

图在表示和存储多样化且相互关联的信息方面具有天然优势，能够轻松捕捉不同数据类型间的复杂关系和属性。而向量数据库在处理这类结构化信息时则显得力不从心，它们更擅长通过高维向量处理非结构化数据。在 RAG 应用中，结合结构化的图数据和非结构化的文本向量搜索，可以让我们同时享受两者的优势，这也是本文将要探讨的内容。

知识图谱的确很有用，但如何构建一个呢？ 构建知识图谱通常是利用图数据表示的强大功能中最困难的一步。它需要收集和整理数据，这需要对领域知识和图建模有深刻的理解。为了简化这一过程，我们开始尝试使用大型语言模型（LLM）。LLM 凭借其对语言和上下文的深刻理解，可以自动化知识图谱创建过程中的大部分工作。通过分析文本数据，这些模型能够识别实体，理解它们之间的关系，并提出如何在图结构中最佳表示这些实体。基于这些实验，我们已经将图构建模块的首个版本集成到了 LangChain 中，本文将展示其应用。

Neo4j 环境搭建

为了跟随本文的示例，您需要搭建一个 Neo4j 实例。最简单的方法是在 Neo4j Aura 上启动一个免费实例，它提供了 Neo4j 数据库的云版本。当然，您也可以通过下载 Neo4j Desktop 应用程序来创建一个本地数据库实例。

os.environ["OPENAI_API_KEY"] = "sk-"
os.environ["NEO4J_URI"] = "bolt://localhost:7687"
os.environ["NEO4J_USERNAME"] = "neo4j"
os.environ["NEO4J_PASSWORD"] = "password"

graph = Neo4jGraph()

此外，您还需要一个 OpenAI 密钥，因为我们将在本文中使用他们的模型。

数据导入

在本次演示中，我们将使用伊丽莎白一世的维基百科页面。我们可以利用 LangChain 加载器轻松地从维基百科获取并分割文档。

# 读取维基百科文章
raw_documents = WikipediaLoader(query="Elizabeth I").load()

# 定义分块策略
text_splitter = TokenTextSplitter(chunk_size=512, chunk_overlap=24)
documents = text_splitter.

最低0.47元/天解锁文章