RAG学习总结

最新推荐文章于 2024-07-25 15:44:40 发布

gz927cool

最新推荐文章于 2024-07-25 15:44:40 发布

阅读量484

点赞数 9

文章标签：自然语言处理 prompt 语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gz927cool/article/details/137747147

版权

What it is ?

Retrieval Augmented Generation 检索增强生成
一种将大模型与额外数据源相结合的方法，通过检索的方式获取与问题相关的信息，以此提升模型生成的生成效果。

How it works?

从额外的知识库中检索与问题query相关的信息，将检索的结果与原提示词prompt共同传递给大模型，利用其上下文学习in-context learning能力让LLM生成更好、更具事实性的结果output

构建知识库
- 格式转换
- 文本切分
  - fixed-size
  - variable-size chunking strategy
    天然的切分：如社交媒体、产品描述
    分隔符切分
- 数据清洗
  extract, clean, format
检索
- 向量检索
  embedding model
  vector database
- 词法检索
  关键词检索
  
  adopting keyword-based search allows us to perform clever tricks like promoting documents with important keywords, excluding documents with negative keywords, or even augmenting documents with synthetically-generated data for better matching

Why it is useful?

直接注入可靠 (correct, specific, and up-to-date) 的相关信息，利用了大模型的上下文学习能力
应对大模型的如下问题：
幻觉问题（hallucination）、截至日期问题（knowledge cutoffs）、专有数据问题（specialized domains、proprietary data）
易于实现、成本低、性能提升

评估

retrieval system评估：获取用户反馈，然后使用传统的检索指标： DGC、 nDGC
generation component评估: RAGAS 、LLM as a judge

RAGAS:

Retrieval Augmented Generation Assessment ，在无人工标注数据集或参考答案的情况下评估复杂的RAG流程

定位相关文档的能力：context relevance --> 让LLM判断context句子与问题是否相关
利用context的能力: faithfulness --> 先引导LLM从回答中抽取陈述，然后引导LLM判断该陈述能否从context中推断出
产生高质量的输出: answer relavance --> 引导LLM根据回答生成潜在的问题，计算它与真实问题的相似度

质量保证：

检索方面：
使用混合检索；
纯向量检索倾向于包含假正例（false positives)，可能包含噪音数据
基于关键词的检索允许使用一些小技巧来提升效果，比如
使用重要的关键词扩充文档
排除包含负关键字（negative keywords）的文档
使用合成数据（synthetically-generated data ）增强文档
评估方面：
以引用的形式向用户展示用于生成的context，引导用户进行二元反馈

进一步提升

数据方面：
- 内容：
  抽取、清理、格式化 extract, clean, and format
- 步骤：
  大量观察数据
  检查是否存在不需要的内容
  向数据处理流程中添加更改来处理发现的问题
- 新方法：
  使用大模型自动构建数据清理流程
检索方面：
embedding模型微调
添加ranking: cross_encoder \ ColBert

生成方面：

利用高质量数据微调大模型
提示词策略：
- 添加选择组件，以最大化上下文多样性
  应用于检索流程之后！
  步骤：
  使用检索获取相对较大的context候选集
  从候选集中选择与问题最相关的
  从剩余候选集中选择与已选择文档最不相似的
- 优化context的结构（大模型获取的位于context中间信息时性能降低）

关注

9
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
RAG学习总结

RAG一种将大模型与额外数据源相结合的方法，通过检索的方式获取与问题相关的信息，以此提升模型生成的生成效果
复制链接

扫一扫

gz927cool CSDN认证博客专家 CSDN认证企业博客

码龄12年

18: 原创

21万+: 周排名

6万+: 总排名

1万+: 访问

: 等级

303: 积分

52: 粉丝

87: 获赞

15: 评论

113: 收藏

私信

关注

热门文章

分类专栏

最新评论

面试问题记录（LLM）
CSDN-Ada助手: 恭喜您发布了第13篇博客！看到您记录了面试问题（LLM）的内容，实在是非常有用啊！希望您能继续保持创作的热情，分享更多有价值的内容给大家。或许您可以考虑分享一些面试经验或者职场心得，让更多人受益。期待您的下一篇作品！祝您创作顺利！
huggingface下载模型&数据集实践
CSDN-Ada助手: 恭喜您发布了第12篇博客“huggingface下载模型&数据集实践”！文章内容很实用，对于想要学习如何下载模型和数据集的读者来说肯定非常有帮助。希望您能继续保持创作的热情，分享更多有趣的技术实践经验。下一步，建议您可以尝试探讨如何利用这些下载的模型和数据集进行深入的应用和分析，或者分享一些解决实际问题的案例分析，让读者更好地理解和运用所学知识。期待您更多精彩的分享！
DEBUG记录 RuntimeError: cuDNN version incompatibility
CSDN-Ada助手: 恭喜您写了第11篇博客！看到您解决了“DEBUG记录 RuntimeError: cuDNN version incompatibility”这个问题，真的很棒！希望您能继续分享更多关于技术方面的经验和解决问题的方法，也可以尝试写一些关于实际应用场景或者案例分析的文章，让读者更容易理解和应用您的经验。期待您的下一篇作品！祝您创作顺利！
面试问题记录（基础&RAG)
普通网友: 文章构思巧妙，结构紧凑，既有深度又有广度，读后让人受益匪浅，确实是一篇值得一读的佳作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
面试问题记录（基础&RAG)
普通网友: 博主的文章让我对这个主题有了全新的认识，细节描写非常到位，让我感受到了博主的深厚功底。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。