4 RAG中的检索器(Retriever)
在RAG(检索增强生成)框架中,"R"代表检索。它在RAG管道中的作用是从庞大的知识库中检索出最相关的前k个文档。然而,构建一个高质量的检索器并非易事。本部分围绕三个关键问题进行讨论:
- 如何获得准确的语义表示?
- 如何匹配查询和文档的语义空间?
- 如何使检索器的输出与大型语言模型的偏好相一致?
4.1 如何获得准确的语义表示?
- 块优化
- 在处理外部文档时,第一步是进行分块,以获得细粒度特征,然后将这些块进行嵌入。
- 需要找到语料库中文档的最佳块大小,以确保搜索结果的准确性和相关性。
- 选择分块策略时,需要考虑被索引内容的特点、嵌入模型、用户查询的预期长度和复杂度,以及特定应用中检索结果的使用方式。
- 微调嵌入模型
- 在获取适当大小的块之后,需要通过嵌入模型将块和查询嵌入到语义空间中。
- 优秀的嵌入模型如UAE、Voyage、BGE等已经在大规模语料库上进行了预训练。
- 针对特定任务的嵌入模型微调对于确保模型理解用户查询与内容相关性至关重要。
- 微调应包括领域知识微调和下游任务的微调。
4.2 如何匹配查询和文档的语义空间?
- 查询重写
- 将查询和文档的语义对齐最直观的方式是重写查询。
- 利用大型语言模型的内在能力生成伪文档,并将原始查询与这个伪文档合并形成新的查询。
- 可以使用抽象推理方法来提取高层次概念和原则,用于检索。
- 嵌入变换
- 在查询编码器后连接一个适配器,并微调适配器以优化查询嵌入的表示,将其映射到更适合特定任务的潜在空间。
- 使用对比学习和Masked Entity Prediction等方法,使检索器意识到结构化信息。
4.3 如何使检索器的输出与LLM的偏好一致?
- LLM监督训练
- 利用大型语言模型的反馈信号来微调嵌入模型。
- 使用编码器-解码器架构和跨注意力得分进行微调。
- 使用硬负采样和标准交叉熵损失。
- 插入适配器
- 当无法直接微调嵌入模型时,使用适配器进行对齐。
- 通过上下文提取阶段和奖励驱动阶段训练适配器,优化检索器的输出。
- 根据基于token的自回归策略优化检索器的输出。
相关文章
链接:
LLM与RAG的初识-1
LLM与RAG的初识-2
LLM与RAG的初识-3
参考文献
[1] Yunfan G, Yun X, Xinyu G, Kangxiang J, Jinliu P, Yuxi B, Yi D, Jiawei S, Haofen W, et al. Retrieval-Augmented Generation for Large Language Models: A Survey[J], CoRR, 2023, abs/2312.10997
[2] Deng C, Yan W, Lemao L, Shuming S, et al. Recent Advances in Retrieval-Augmented Text Generation[C], Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 2022: 3417–3419.
[3] Ruochen Z, Hailin C, Weishi W, Fangkai J, Do X L, Chengwei Q, Bosheng D, Xiaobao G, Minzhi L, Xingxuan L, Shafiq J, et al. Retrieving Multimodal Information for Augmented Generation: A Survey.[J], CoRR, 2023, abs/2303.10868: 4736-4756.
[4] Xin C, Di L, Xiuying C, Lemao L, Dongyan Z, Rui Y, et al. Lift Yourself Up: Retrieval-augmented Text Generation with Self Memory[J], CoRR, 2023, abs/2305.02437
[5] Zhihong S, Yeyun G, Yelong S, Minlie H, Nan D, Weizhu C, et al. Enhancing Retrieval-Augmented Large Language Models with Iterative Retrieval-Generation Synergy.[J], CoRR, 2023, abs/2305.15294: 9248-9274.
[6] Menglin X, Xuchao Z, Camille C, Guoqing Z, Saravan R, Victor R, et al. Hybrid Retrieval-Augmented Generation for Real-time Composition
Assistance[J], CoRR, 2023, abs/2308.04215
[7] Zachary L, Chenglu L, Wangda Z, Anoushka G, Owen H, Millie-Ellen P, Wanli X, et al. Retrieval-augmented Generation to Improve Math Question-Answering: Trade-offs Between Groundedness and Human Preference[J], CoRR, 2023, abs/2310.03184