RAG多路召回

最新推荐文章于 2025-03-13 19:23:04 发布

pumpkin84514

最新推荐文章于 2025-03-13 19:23:04 发布

阅读量2.2k

点赞数 10

分类专栏： AI相关学习文章标签：笔记

本文链接：https://blog.csdn.net/pumpkin84514/article/details/145150498

版权

AI相关学习专栏收录该内容

104 篇文章

订阅专栏

什么是多路召回？

多路召回（Multi-Route Retrieval） 是指在信息检索系统中，为了提升检索的全面性和准确性，通过多条不同的检索路径或不同的检索策略来获取信息的技术。多路召回的核心思想是，单一的检索路径可能会遗漏一些重要的信息或没有覆盖所有可能相关的内容，因此需要并行或串行地采用多种检索方法来提高最终的召回率和准确性。

在 RAG (Retrieval-Augmented Generation) 模型中，多路召回通常用于增强检索阶段的多样性和精准度。通过结合不同的召回策略，系统能够在多个来源或角度中获取信息，从而改善生成模型的输入质量和最终生成的答案。

多路召回的原理

多样化查询路径：
- 传统的检索方法依赖于单一的查询策略，而多路召回通过同时使用多个查询策略来触及不同的信息源。每条路径可能使用不同的关键词、查询方式或检索模型。
- 比如，可以通过经典的 TF-IDF 查询策略、基于 向量空间模型（如 BM25）的检索，或者通过 深度学习模型（如 BERT）来生成查询。
多源信息获取：
- 通过多路召回，可以从不同的数据源或索引库中获取信息。例如，除了从文档库中检索外，还可以从 外部数据库、用户行为日志 或 推荐系统 中获取信息。
多层次的排序与融合：
- 在多路召回中，每条路径返回的候选信息会进行合并和排序。通常会根据不同的评分机制（如基于模型的评分、语义匹配度、点击率等）对召回结果进行融合，以确保最终返回的结果是最相关和最准确的。
重排序（ReRanking）：
- 在多路召回的结果中，进行后续的重排序，以优化最终的结果顺序，确保召回的候选项是最相关的。

多路召回的实现步骤

构建多个检索通道：
- 选择多个检索策略或者模型，如传统的关键词检索、基于语义的检索（如 BERT）、基于用户画像的检索等。
检索并返回候选项：
- 使用每个检索通道独立进行检索，并返回一批候选项。
候选项的融合与排序：
- 对不同通道返回的候选项进行融合，使用重排序算法对候选项进行排序，确保最终返回最相关的结果。
生成最终答案：
- 基于融合排序后的结果，生成最终的答案或文档。

举例：

假设我们正在构建一个智能问答系统，用户输入的问题是“如何学习 Python 编程”。为了提高查询的准确性和多样性，我们可以使用以下多路召回策略：

通道 1 - 关键词匹配：
- 通过 TF-IDF 等传统信息检索方法，基于“如何学习”和“Python 编程”进行查询。
通道 2 - 基于语义的匹配：
- 使用 BERT 等深度学习模型进行语义匹配，理解用户查询意图，返回相关文档或回答。
通道 3 - 基于用户画像：
- 根据用户的历史查询或兴趣（如“数据科学”相关查询），进行个性化的查询扩展，从而检索出与用户兴趣相关的学习资源。
通道 4 - 基于推荐系统：
- 结合推荐算法，如 协同过滤，从用户浏览过的相关内容中推荐出相似的学习资源。
候选项融合与排序：
- 将以上四个通道的结果融合，并使用 重排序算法（如基于点击率或语义相似度的排序）进行排序，最终生成用户最可能感兴趣的学习资源列表。