强大新RAG范式！动态将上下文转化为参数知识，有效缓解RAG幻觉！

最新推荐文章于 2025-04-22 09:47:43 发布

zenRRan

最新推荐文章于 2025-04-22 09:47:43 发布

阅读量115

点赞数 1

原文链接：https://mp.weixin.qq.com/s?__biz=MzI3ODgwODA2MA==&mid=2247537279&idx=2&sn=b8cc8b2f5b33a51f73b04adf3cb5dddf&chksm=ea5bfba17caf34694d5433d40cf6ac8371617ab3be491862acbbc83970e3264b5f0071c0f632&scene=126&sessionid=0

版权

检索增强生成（RAG）通过从外部源检索相关文档并将其合并到上下文中来增强大语言模型（LLMs）。虽然它通过提供事实文本提高了可靠性，但随着上下文长度的增长，显著增加了推理成本，并引入了具有挑战性的RAG幻觉问题，这主要是由于LLM中缺乏相应的参数知识造成的。

参数化RAG （PRAG）通过离线训练将文档嵌入大模型参数有效地降低推理成本。然而其高昂的训练和存储成本以及有限的泛化能力，极大地限制了其实际应用。

我们提出动态参数化RAG，在推理时将文档知识动态转化为模型参数知识，能有效补充相应知识。并且能即插即用无缝和RAG结合，提升模型知识内化水平同时减少RAG幻觉的发生。

论文：Better wit than wealth: Dynamic Parametric Retrieval Augmented Generation for Test-time Knowledge Enhancement
链接：https://arxiv.org/pdf/2503.23895
项目：https://github.com/Trae1ounG/DyPRAG

编辑：深度学习自然语言处理公众号

方法

DyPRAG的核心思路在于训练一个轻量的参数转换器来建模从文档->参数的潜在映射，仅需要少量的训练数据就能有效学习到泛化性极强的转换器，在推理时几乎不会引入额外的计算开销且能提升模型性能，最少只需要2MB存储开销。

DyPRAG对比RAG和PRAG

实验

分布内QA实验

在多个问答数据集上训练参数转换器并进行实验，DyPRAG表现出极优的性能：

DyPRAG能有效注入参数知识：对比RAG，在没有提供任何文档拼接到上下文的情况下，DyPRAG表现出明显优于RAG的性能同时减少了推理开销。
上下文知识+动态生成参数知识有效促进知识融合：DyPRAG-Combine将文档加入上下文结合动态生成参数知识，在所有情况下取得最好效果，有效促进了模型知识和上下文知识的融合。

分布内主实验

分布外QA实验

DyPRAG能有效转换分布外的文档到参数知识，在补充参数知识后始终可以作为相比RAG更强更鲁棒的基线。

分布外数据集实现

为什么DyPRAG能减少RAG幻觉？

RAG幻觉（或叫知识冲突）经常由于模型内部知识和外部提供上下文知识发生冲突导致发生。可能模型包含正确的参数知识但结合上下文知识报错，也可能上下文知识正确但模型包含错误参数知识导致模型回答错误。
DyPRAG首先动态将检索文档转换为模型参数知识，提前让模型“做足了功课”，在遇到相对应的上下文内容时就能极大程度避免知识冲突发生，这也是DyPRAG-Combine性能提升的直接来源，极低的开销使得DyPRAG有希望成为RAG幻觉的有效解决方式。