2025年开源RAG最佳选择：浙大与蚂蚁的 KAG 技术突破

AI大模型-海文

于 2025-02-27 16:29:29 发布

阅读量1.3k

点赞数 10

文章标签：人工智能前端 javascript ai easyui

本文链接：https://blog.csdn.net/HUANGXIN9898/article/details/145907628

版权

一、KAG简介

浙江大学与蚂蚁集团推出的知识增强生成（KAG）框架，旨在解决传统检索增强生成（RAG）方法在多跳推理和复杂逻辑处理中的不足。KAG通过结合知识图谱（KGs）和创新技术，显著提升了大语言模型在专业领域问答中的准确性和效率。

KAG框架的五大创新亮点：

LLM友好的知识表示：通过层次化的知识组织，使大语言模型更适应专业领域的知识处理。
知识图谱与文本块互索引：提高了数据检索的精确度和效率，增强了知识的整合能力。
逻辑形式引导推理：结合语言推理与符号推理，支持复杂的多轮推理和问题求解。
知识对齐与语义推理：通过语义推理对齐不同层次的知识，提升了推理的准确性。
模型能力增强：优化大语言模型的推理能力，提升了专业领域问答系统的整体表现。

在蚂蚁集团，KAG成功应用于电子政务和电子健康项目。在电子政务中，KAG开发了一个高效的政府服务问答系统；在电子健康中，KAG提升了医疗问答系统的准确度，尤其在医学指标解读和推荐方面，展现了强大的推理能力。
在这里插入图片描述

不同 RAG 模型在三个多跳问答数据集上的端到端生成性能。粗体和下划线的值分别是最佳指标和第二佳指标

二、KAG与常见RAG优化方法的比较

KAG框架在多跳推理和复杂查询处理上明显优于传统的RAG方法。为了更好地理解KAG的优势，以下是与常见几种RAG优化方法的对比：

Light RAG 和 Graph RAG：这两种方法通过使用知识图谱保持实体间的逻辑连接，解决了传统RAG方法在处理实体之间关系时丧失逻辑连贯性的问题。它们通常通过简单的知识图谱索引来进行检索，较为依赖基础的相似性匹配。
KAG：相比于Light RAG和Graph RAG，KAG不仅仅保留了知识图谱中的实体关系，还引入了多跳问答和推理能力。KAG框架的核心优势在于其通过逻辑形式推理引擎，将复杂问题分解为多个子问题，通过多次检索和推理逐步构建答案。KAG能够在不同的推理层面上进行跨模态的信息处理，使得多步推理问题得到有效解决。

简而言之，KAG不仅仅保持了知识图谱的优势，还通过更为复杂的推理流程，提升了LLM在处理复杂问题时的能力。

三、KAG在数据摄取和数据查询阶段的优化

KAG在数据摄取(Data Ingestion)和数据查询(Data Querying)两个阶段进行了诸多优化，以确保大语言模型能更准确、高效地响应复杂查询。以下是其在这两个阶段的创新：

在这里插入图片描述

数据摄取阶段的优化

LLM友好的知识表示：KAG使用LLMFriSPG框架，这是一种为LLM定制的知识表示方式，它将知识组织成层次结构，包括数据、信息和知识。该框架支持无模式的信息提取，以及模式约束的专业知识构建，有效解决了不同领域知识的表示问题。
互索引系统：KAG建立了知识图谱和原始文本块之间的互索引系统，保证了知识图谱和文本块的统一表示、推理和检索。这种互索引方式使得KAG能够高效地从知识图谱中获取有价值的信息，同时增强了推理的深度和精度。
语义分块：为了更好地适应LLM的输入要求，KAG将文档划分为语义一致的语义块，每个块都包含ID、摘要、主要文本等字段，并且维护原文档与分块之间的双向关系。这种分块方式使得每个语义块都能保持独立的上下文和主题一致性。
信息提取与知识图谱构建：KAG通过信息提取（例如实体、事件、关系等）构建了KGfr（知识图谱框架），并通过互索引将这些提取的知识和文本块关联起来。通过这种方式，KAG能够更精确地进行知识的索引和推理。

数据查询阶段的优化

逻辑形式引导的混合推理引擎：KAG使用逻辑形式引导的混合推理引擎，通过将自然语言问题转化为符号化的推理问题，实现了多种推理方式的组合，如文本检索、知识图谱推理、语言推理和数值计算。这种多元化的推理方式使得KAG能够更加精确地处理复杂的查询。
多轮解题机制：在面对复杂问题时，KAG能够通过多轮推理机制反思和存储中间结果，确保问题得到有效解决。如果一个问题无法一次解决，系统会在全局记忆中存储结果，并生成补充性问题以进一步推理。
语义推理与知识对齐：KAG利用语义推理和知识对齐技术，通过对知识图谱中不同粒度的知识进行语义对齐，降低噪声，提高图谱的连通性和准确性。这使得KAG在处理需要深度理解的查询时，能够利用语义推理弥补知识图谱中的空白。

四、KAG在蚂蚁集团的电子政务及电子健康项目上的应用

KAG框架已在蚂蚁集团的电子政务和电子健康项目中得到了实际应用，以下是两个典型案例：

4.1 KAG在电子政务中的应用

在电子政务项目中，KAG被应用于构建一个支持政府服务问答的系统。该系统可以回答用户关于服务方法、所需材料、服务条件和服务地点等问题。系统的建设过程中，KAG框架使用了11,000篇政府服务文档，并通过逻辑形式推理、语义增强等技术，提升了问答准确性和服务效率。
在这里插入图片描述

4.2 KAG在电子健康中的应用

在电子健康项目中，KAG被应用于构建一个医疗问答系统，能够回答用户关于疾病症状、疫苗接种、医疗指标等问题。系统使用了来自医学专家的权威文档，构建了超过180万个实体和40万个术语集，通过KAG框架，提供了超过700条医疗指标计算规则。这一应用显著提高了医疗问题的解答效率和准确性，特别是在复杂的医学问题上。

五、快速上手

对于普通用户，KAG提供了简单的安装步骤，以下是如何快速启动KAG系统：

5.1 环境与依赖项安装

macOS 用户：macOS Monterey 12.6或更高版本
Linux 用户：CentOS 7 / Ubuntu 20.04或更高版本
Windows 用户：Windows 10 LTSC 2021或更高版本，配合WSL 2 / Hyper-V，Docker，Docker Compose

5.2 使用步骤

1. 下载并启动KAG服务：

curl -sSL https://raw.githubusercontent.com/OpenSPG/openspg/refs/heads/master/dev/release/docker-compose-west.yml -o docker-compose-west.yml
docker compose -f docker-compose-west.yml up -d

2. 访问KAG产品：在浏览器中输入以下URL：http://127.0.0.1:8887

通过这些简单的步骤，用户可以快速启动并体验KAG框架的强大功能。

六、总结

KAG（知识增强生成）框架通过结合知识图谱与大语言模型，显著提升了模型在处理复杂查询和多跳推理时的能力。通过在数据摄取和查询阶段的优化，KAG能够更精确地进行知识推理、信息检索及语义增强，尤其在电子政务和电子健康等专业领域应用中展现了其强大的实际效能。随着技术的不断发展，KAG将在更多领域中得到广泛应用，并有望继续推动大语言模型在专业领域的突破。

KAG不仅仅是一个技术框架，它的创新性将为更多行业带来智能化转型的机会，未来的发展值得期待。

参考链接：