简介
- 知识图谱及其在机器学习和学术研究中的应用
- 图 RAG:结合知识图谱提升语言模型性能
- 历史链(CoH)推理:时态知识图预测方法
- Right for Right Reasons(R3):构建可验证的常识知识图谱问答方法
- 网络钓鱼攻击及其基于知识图谱的检测技术
- 协调 RAG 和 KG:在自然语言处理中融合检索增强生成和知识图
- GRAPE:基于图的知识增强段落阅读器
- ISEEQ:利用知识图谱增强信息寻求问题生成
什么是知识图谱?
知识图谱这个概念最初由 Google 在 2012 年提出,用来指代其构建的知识库。知识图谱是强大的工具,用于组织和关联来自多个来源的数据,帮助理解有关利益相关者的信息并尝试在他们之间建立联系。知识图谱广泛应用于搜索引擎、聊天机器人和推荐系统等领域,它通过提供丰富的背景知识、类人意识和概念,使得与文本相关的任务更加高效。
在机器学习领域,知识图谱同样扮演着重要角色。它通过以下方式为机器学习任务提供支持:
- 减少对大规模标记数据集的需求,因为知识图谱本身就是一个结构化的数据集。
- 支持迁移学习,允许模型在不同的任务和领域之间共享知识和经验。
- 促进跨领域学习,通过建立实体之间的联系,使得模型能够更好地理解复杂的数据。
知识图的示例。资料来源:研究图基金会https://researchhgraph.org/。
知识图谱的使用不仅限于商业应用,在学术界也有广泛的应用。许多研究数据库,如 OpenAlex、Dimensions 和 Lens,都依赖于知识图谱来帮助研究人员。这些工具通过提供丰富的元数据,如书目知识、出版物和引文,来增强研究人员的分析能力,从而推动研究的发展。
图 RAG:RAG & 知识图谱
Graph RAG 是在 RAG 概念的基础上,通过整合知识图谱(KG)来构建的创新方法。这个概念最初由 NebulaGraph提出,它通过将图数据库与 LLM 结合,改变了LLMs解释和响应查询的方式
KG 是现实世界实体及其关系的结构化表示,由节点和边构成,其中节点代表实体(如人、地点、物体或概念),而边则代表实体间的关系或连接。Graph RAG 的创新能力是将 KG 中的结构化数据集成到 LLM 的处理过程中,这种结构化的数据使得模型能够访问精确且上下文相关的数据,为模型的响应提供更为细致和丰富信息的能力。
在图数据库领域,流行的产品包括 Ontotext、NebulaGraph 和 Neo4J。
与传统的 RAG 方法相比,Graph RAG 在处理上下文复杂查询方面的优势变得显而易见,传统的 RAG 技术常常无法解决上下文复杂的问题。它的响应不仅准确,而且更