MemoRAG｜下一代 RAG 框架

Johntill

已于 2024-09-20 11:29:22 修改

阅读量1.1k

点赞数 19

分类专栏： RAG 文章标签：开源

于 2024-09-20 11:28:15 首次发布

本文链接：https://blog.csdn.net/Johntill/article/details/142380022

版权

RAG 专栏收录该内容

6 篇文章

订阅专栏

随着检索增强生成 (RAG) 系统的发展，一个根本挑战仍然存在——处理复杂、模糊的查询和非结构化知识。传统的 RAG 系统非常适合提供明确信息的简单问答任务，但在面对更细微的场景时就会失败。进入MemoRAG，这是一个突破性的框架，它通过集成长期记忆功能将 RAG 推向新领域，实现更深入的上下文理解和更准确的信息检索。

今天我们将深入探讨 MemoRAG 背后的创新，以及它为何代表了 RAG 领域的重大飞跃。

在这里插入图片描述

认识 MemoRAG

MemoRAG 是一个基于内存的 RAG 创新性框架，通过高效、超长内存模型支持各种应用场景。与传统的 RAG 不同，MemoRAG 利用其内存模型来实现对整个数据集的全局理解记忆，通过从记忆中生成查询特定线索来增强证据检索，还会从数据集的“记忆”中提取信息，从而生成更准确和上下文丰富的答案。MemoRAG 的社区开发非常活跃，此存储库中自9月4日不断发布资源和原型。

【https://github.com/qhjqhj00/MemoRAG/blob/main/asset/tech_case.jpg】

MemoRAG 工作原理

MemoRAG 是双模型系统架构，采用两种不同的模型：

记忆模型：轻量级、远程语言模型创建了数据集的全局记忆。它充当知识库，在非常长的上下文（100万个token）中压缩和保留关键信息。该模型生成线索或部分答案，指导相关信息的检索。
检索-生成模型：一个更强大、更具表现力的语言模型，它根据记忆模型生成的线索，从数据库中检索必要的证据，并生成最终的高质量答案。