下一代RAG：MemoRAG

AI劳模

于 2024-09-12 10:16:12 发布

阅读量445

点赞数 8

文章标签：大模型语言模型 LLM 人工智能大语言模型 RAG MemoRAG

本文链接：https://blog.csdn.net/2401_85373396/article/details/142167925

版权

MemoRAG是一个建立在高效、超长记忆模型之上的创新 RAG（Retrieval-Augmented Generation）框架，由智源研究院（北京人工智能研究院）与中国人民大学高瓴人工智能学院联合推出并开源。

MemoRAG：通过记忆启发的知识发现迈向下一代RAG，为 RAG 提供基于内存的数据接口，适用于多种用途的应用程序！

MemoRAG与主要处理具有明确信息需求查询的标准 RAG 不同，MemoRAG利用其记忆模型实现对整个数据库的全局理解。通过从记忆中回忆与查询相关的线索，MemoRAG增强了证据检索，从而产生更准确、更丰富的上下文响应。

在处理需要对整个数据库进行高级理解的查询时，标准RAG与MemoRAG之间的比较，以《哈利·波特》书籍作为数据库。左侧图，由于输入查询的隐含性质，标准RAG难以准确定位所需的证据，导致答案不够准确。右侧图，MemoRAG构建了覆盖整个数据库的全局记忆。当提出查询时，MemoRAG 首先回忆相关线索，使有用的信息得以检索，从而得到一个精确且全面的答案。

MemoRAG特点

全局记忆：在单个上下文中处理高达100万个token，为庞大的数据集提供全面的了解。
可优化与灵活：轻松适应新任务，仅需几个小时的额外训练即可实现优化性能。
上下文线索：从全局记忆中生成精确线索，将原始输入与答案连接起来，并从复杂数据中解锁隐藏的洞察。
高效缓存：通过支持缓存分块、索引和编码，将上下文预填充速度提高多达30倍。
上下文重用：一次性编码长上下文，并支持重复使用，提高需要重复数据访问的任务的效率。

在三个基准上测试了MemoRAG，使用了三种不同的生成器（Llama3-8B-Instruct-8K、Phi-3-mini-128K、Mistral-7B-Instruct-v0.2-32K），得出以下结论：

主要实验结果。每个版块中最好的结果以粗体显示。这些实验中使用的记忆模型是基于 Mistral-7B-Instruct-v0.2-32K 训练的，可在 HuggingFace 上获取。

MemoRAG 在所有数据集上的表现都超过了所有基线模型，展示了其强大的领域泛化能力。
直接将完整上下文输入到大型语言模型（LLMs）通常比其他 RAG 方法（BGE-M3、Stella-v5 和 HyDE）表现更好。这一发现揭示了标准 RAG 系统在处理长上下文和高级问题方面的困难。
相比之下，MemoRAG 一贯超越了直接使用完整上下文的性能，展示了其有效弥合处理超长上下文和解决复杂任务之间差距的能力。
MemoRAG 在三个领域内数据集上展示了卓越的性能，这表明其潜力可以通过更多样化的训练数据进一步增强。

MemoRAG使用

可以直接用 HuggingFace 模型初始化。通过该MemoRAG.memorize()方法，记忆模型可以在较长的输入上下文中构建全局记忆。

TommyChien/memorag-qwen2-7b-inst可以处理最多400K个token的上下文，
TommyChien/memorag-mistral-7b-inst可以管理最多128K个token的上下文。
通过增加参数beacon_ratio，可以扩展模型处理更长上下文的能力。例如，TommyChien/memorag-qwen2-7b-inst可以处理最多一百万个token beacon_ratio=16。

from memorag import MemoRAG

# Initialize MemoRAG pipeline
pipe = MemoRAG(
    mem_model_name_or_path="TommyChien/memorag-mistral-7b-inst",
    ret_model_name_or_path="BAAI/bge-m3", 
    gen_model_name_or_path="mistralai/Mistral-7B-Instruct-v0.2", # Optional: if not specify, use memery model as the generator
    cache_dir="path_to_model_cache",  # Optional: specify local model cache directory
    access_token="hugging_face_access_token",  # Optional: Hugging Face access token
    beacon_ratio=4
)

context = open("examples/harry_potter.txt").read()
query = "How many times is the Chamber of Secrets opened in the book?"

# Memorize the context and save to cache
pipe.memorize(context, save_dir="cache/harry_potter/", print_stats=True)

# Generate response using the memorized context
res = pipe(context=context, query=query, task_type="memorag", max_new_tokens=256)
print(f"MemoRAG generated answer: \n{res}")

运行上述代码时，编码后的键值 (KV) 缓存、Faiss 索引和分块段落都存储在指定的中save_dir。之后，如果再次使用相同的上下文，则可以快速从磁盘加载数据：

pipe.load("cache/harry_potter/", print_stats=True)

通常，加载缓存权重非常高效。例如，使用内存模型对200K令牌上下文进行编码、分块和索引大约需要35秒，但从缓存文件加载时只需1.5秒。

摘要任务

要执行摘要任务，请使用以下脚本：

res = pipe(context=context, task_type="summarize", max_new_tokens=512)
print(f"MemoRAG summary of the full book:\n {res}")

https://github.com/qhjqhj00/MemoRAG
https://arxiv.org/pdf/2409.05591
MemoRAG: Moving Towards Next-Gen RAG Via Memory-Inspired Knowledge Discovery

读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型！

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
在这里插入图片描述

👉AI大模型学习路线汇总👈

大模型学习路线图，整体分为7个大的阶段：（全套教程文末领取哈）

第一阶段： 从大模型系统设计入手，讲解大模型的主要方法；

第二阶段： 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段： 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段： 大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段： 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段： 以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段： 以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频，看书籍和视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。
在这里插入图片描述

👉学会后的收获：👈

• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求： 大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能， 学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力： 大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

👉获取方式：

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
在这里插入图片描述

AI劳模

关注

8
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
下一代RAG：MemoRAG

res } ")res } ")读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用如果你是零基础小白，想快速入门大模型是可以考虑的。一方面是学习时间相对较短，学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型！😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓。
复制链接

扫一扫