蚂蚁：基于LLM双摘要的迭代式RAG框架

最新推荐文章于 2024-09-27 17:31:02 发布

大模型任我行

最新推荐文章于 2024-09-27 17:31:02 发布

阅读量484

点赞数 12

分类专栏：大模型-RAG 文章标签：人工智能自然语言处理语言模型

本文链接：https://blog.csdn.net/weixin_46739757/article/details/141459906

版权

大模型-RAG 专栏收录该内容

28 篇文章 0 订阅

订阅专栏

在这里插入图片描述

📖标题：Retrieve, Summarize, Plan: Advancing Multi-hop Question Answering with an Iterative Approach
🌐来源：arXiv, 2407.13101

🛎️文章简介

🔸研究问题：在多跳问答场景中，传统RAG技术在单一检索迭代中无法聚合所有关键信息，导致答案不完整或不正确。
🔸主要贡献：论文提出了一种名为ReSP的迭代式RAG方法，通过压缩检索到的文档信息并生成当前子问题的回答，解决了多轮检索导致的上下文过载和重复规划问题。

📝重点思路

🔺相关工作

🔸RAG是通过从外部数据库检索相关文档，并将其集成到生成过程中来增强LLM，近期研究可分为单轮和迭代两种方案。
🔸多跳问答场景中，迭代RAG通常会取得更好的结果，因为它允许对问题进行详细分解。
🔸由于迭代次数的增加，迭代RAG在长上下文处理中面临挑战。

🔺ReSP概述

🔸ReSP框架由推理器、检索器、摘要器和生成器四个组件构成。
🔸推理器、检索器和生成器都基于无需微调的LLM，由提示工程执行任务，与传统的迭代RAG方法类似。
🔸摘要器的目标是解决上下文过载和冗余规划，在压缩信息的同时避免重复迭代。
🔸因此提出了双功能摘要器，不仅生成与问题相关的全局证据信息，还要生成当前子问题的响应来控制迭代。