RAG优化

Sophie'sCookingLab

已于 2024-06-28 17:28:58 修改

阅读量449

点赞数 5

分类专栏：大模型文章标签：人工智能

于 2024-06-22 21:31:49 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40566713/article/details/139888450

版权

大模型专栏收录该内容

79 篇文章

订阅专栏

目前想到的优化方案：
1、使用大模型，提示工程对query进行改写；
2、使用大模型对检索的结果进行改写；
3、rerank排序；
4、prompt优化；
5、原始文本清洗优化。

RAG Fusion
互惠排名融合

RAG介绍

1、大模型的局限性
2、什么是检索增强的语言模型(Retrieval-based LMs)
3、为什么要使用检索增强的语言模型（Retrieval-based LMs）
4、RAG和SFT微调有什么不同？

知识库构建

1、为什么要进行文本切块？
2、选择分块策略时，需要考虑哪些要素？
3、分块策略都有哪些？
4、语义分块模型都有哪些？
5、长篇知识如何产生问答对？
6、长文本如何存储用于检索？
7、向量化模型都有哪些？

query扩写模块

1、为什么要进行query扩写？
2、query扩写的prompt如何构建？

粗排模块

1、使用什么相似度模型？
2、为什么要微调bert模型？
3、如何构造微调bert相似度向量模型数据？
4、微调模型中正负样本比例的策略是什么？
5、使用DSSM双塔模型微调bert?
6、微调bert为什么要设置维度系数？
7、微调bert模型的层次选择及其原因？
8、什么是句子窗口检索？
9、什么是父文档检索器？
10、如何提高搜索质量和大语言模型的推理能力？

精排模块

1、什么是交互型模型？
2、bert排序模型
3、介绍一下rerank模型

过滤模块

生成模块

1、prompt模版如何构建？
2、输入文档的顺序对大模型是否有影响？

RAG架构

1、基于Retrieval-based LMs的对话流程是怎么样的？
2、RAG调用模式有几种？分别是什么？

RAG评估

1、如何评估RAG系统的准确率上下限问题？
2、检索模块的评估指标有哪些？
3、RAG评估框架都有哪些

多轮对话

1、如何判断上下文是否关联？
2、上下文长度过长怎么办？

RAG技术挑战

1、数据检索问题的挑战？
2、信息增强问题挑战

相关论文

1、HyDE
2、RAG-Fusion
3、self-rag

RAG（检索增强生成）的优化策略主要包括数据清洗、分块处理、嵌入模型的使用、预检索优化、检索和后检索流程的优化，以及高级优化技术如查询环节优化、检索环节的优化、融合或混合搜索、多种切分方式并行查询、rerank、以及模型微调等。12

数据清洗：删除重复信息、处理缺失值、填充噪声等，以提高模型的准确性。
分块：将较大的文本分成较小的块或段落，降低模型复杂性，便于处理大型文档。
嵌入模型：将文本转换为数值向量，捕捉语义信息，提高RAG性能。
预检索优化：包括提高索引数据的质量和块优化，如数据粒度增强和更好的数据组织。
检索和后检索流程优化：通过有效的查询转换和提示工程技术，增强RAG工作流程的每个组成部分。
高级优化技术：
查询环节优化：包括使用LLM对查询进行改写、理解查询意图并生成多个查询并行检索。
检索环节的优化：采用总分层级索引、父子层级索引、融合或混合搜索、多种切分方式并行查询等方法，提高检索的准确性和稳健性。
rerank：使用cross encoder模型对召回的chunks进行逐个排序，增加MMR及命中率。
模型微调：在成本和数据允许的情况下，对嵌入模型、交叉编码器等进行微调，提升垂直领域检索效果。
这些策略的综合应用可以显著提升RAG的性能，使其在处理复杂查询和大量数据时更加有效和准确。

RAG极致优化：提升性能，实现飞跃！
无限长的上下文，也干不掉的RAG
语义搜索与混合查询：Blended RAG如何提升检索准确性
 RAG与LLM本身知识存在冲突时，大模型如何抉择？

读懂RAG这一篇就够了，万字详述RAG的5步流程和12个优化策略

RAG性能优化终极指南

检索增强生成技术(RAG)深度优化指南：原理、挑战、措施、展望

提升RAG性能的关键技术：从数据清理到混合检索的全方位讨论

关于 RAG 的优化方案及评估

如何优化RAG系统的性能表现？10条实用策略

检索增强生成(RAG)概念及优化

RAG介绍及RAG的优化

再靠近亿点点，RAG 优化策略

检索增强生成（RAG）有什么好的优化方案？

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。