OpenRAG：全面增强RAG推理，超越Self-RAG、RAG 2.0、Command R+

小天才学习机打游戏

于 2024-10-10 19:46:26 发布

阅读量227

点赞数 6

文章标签： r语言开发语言人工智能 langchain 大数据运维知识图谱

本文链接：https://blog.csdn.net/m0_59164520/article/details/142830632

版权

现有的RAG方法在使用开源LLMs处理复杂查询（如多跳检索任务）时，表现出有限的推理能力。

提出了一个名为OPEN-RAG的新框架，旨在提高开源LLMs在RAG中的推理能力。

OPEN-RAG中的推理流程。它学习生成检索/不检索标记，对比相关和不相关上下文，并将答案归类为部分支持、完全支持或不支持。然后在推理时，给定一个（多跳）用户查询，首先强制模型在输入条件为不检索的情况下生成答案，并根据模型的置信度动态决定是否需要检索。

OPEN-RAG将任意密集LLM转换为参数高效的稀疏专家混合（MoE）模型，能够处理包括单跳和多跳查询在内的复杂推理任务。

OPEN-RAG中的架构转换（从密集到PEFT MoE）。路由器R从头开始训练。FFN层保持冻结状态，并由基于并行适配器的专家E进行调整。其他层被复制。

OPEN-RAG通过独特的训练方法，使模型能够导航看似相关但具有误导性的挑战性干扰因素。

训练过程中，模型学习生成检索/不检索的反射标记，并评估检索内容的相关性、支持程度和实用性。

OPEN-RAG训练数据准备涉及从每个原始对（q, y）生成四种新的训练实例的变化，每种都使用真实情况/LLM评论家和检索到的段落，结合不同的反射标记。OPEN-RAG不仅使LLM能够反思生成质量，还能够对比干扰项。

OPEN-RAG推理流程

检索/不检索：模型学会生成检索/不检索的标记，以指示是否需要检索来回答查询。
相关性评估：对于检索到的内容，模型生成相关性标记，指示内容是否与查询相关。
生成答案：根据预测的相关性、支持度和效用标记，对所有可能的答案进行排序，生成最终答案。

在各种知识密集型的单跳/多跳短文/长文推理任务上，基于Llama2-7B的OPEN-RAG在事实准确性和推理能力方面显著优于现有的开源RAG模型，并且常常匹配或超越了最先进的专有LLMs及其RAG模型。

在多个任务中，OPEN-RAG基于Llama2-7B，超越了ChatGPT-RAG、Self-RAG、RAG 2.0和104B RAG-Command R+，树立了新的基准。

OPEN-RAG模型如何通过自适应检索方法在性能和速度之间取得平衡：

自适应检索策略有效：
信心评分：模型在推理时生成检索/不检索的反射标记，并计算输出序列在强制不检索设置下的信心分数。
阈值控制：通过调整阈值γ，可以控制检索的频率。如果模型信心分数低于阈值γ，则触发检索。
信心评分重要：fmeanp（几何平均概率）作为信心评分方法，相比于fminp（最小概率）和fret（外部模型预测的反射标记概率），在所有数据集上都显示出更稳健的性能。
性能与检索平衡：在某些任务中，过高的检索频率并不总是最佳选择；自适应检索可以在适当的时机使用检索，从而在各种检索频率下都取得较好的性能。

（上）不同自适应检索策略的性能对比检索。（下）性能与自适应检索得分对比。fret表示来自外部模型提炼/预测的反射标记的概率得分。

对比不同检索方法的鲁棒性

CRAG方法：CRAG（Corrective Retrieval Augmented Generation）是一种在检索质量较低时使用网络搜索来获取新检索的方法。通过将CRAG方法与OPEN-RAG结合，研究者评估了模型对检索质量的鲁棒性。
结果：OPEN-RAG在结合CRAG数据集时表现优于其他基线，显示出对高质量检索的潜在改进能力。

使用CRAG上下文的模型性能

路由分析

专家激活：通过分析不同任务中专家的激活情况，研究者发现某些专家在特定层次上更活跃，这表明专家能够根据任务的复杂性在不同层次上发挥作用。

单跳（PopQA、PubHealth）与多跳任务（HotpotQA、MuSiQue）的逐层专家激活情况。

在这里插入图片描述

OPEN-RAG限制：

OPEN-RAG的内存占用较高，因为它增加了总参数量（7.81B），与Llama2-7B系列基线（6.74B）相比有所增加。
尽管如此，OPEN-RAG在推理时只有7.01B的活跃参数，与性能相比，实际上降低了计算和内存成本。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述