RAG概述（二）：Advanced RAG 高级RAG

Hugo Lei

已于 2024-05-26 21:28:29 修改

阅读量3k

点赞数 22

分类专栏： LLM工程文章标签：人工智能 LLM 大语言模型生成式AI RAG embedding langchain

于 2024-05-26 16:47:03 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hugo_lei/article/details/139215091

版权

LLM工程专栏收录该内容

26 篇文章

订阅专栏

目录

Pre-Retrieval预检索

增强数据粒度

Small2Big方法

引入假设性问题

Post-Retrieval后检索

概述

Native RAG（基础RAG）体现了RAG开发范式的骨架，也即三段论Indexing-Retrieval-Generation。

Native RAG的不足是，在LLM这种高度不确定的场景下，还是太粗糙了，最终的表现就是效果不够好。

具体表现：

准确性低：Retrieval阶段查询到的块，和query本身的相关性低。可能导致LLM出现幻觉或空中掉物等问题。
召回低：Retrieval阶段查询的块，并没有返回足够多的相关块，进一步降低了LLM构建全面回应的可能性。
组装prompt的问题：这个阶段会将检索到的块和query融合，构建一个prompt给到LLM。若检索到的多个块中包含了相似或重复的内容，可能导致最终LLM生成内容的冗余和重复，也就是表现的婆婆妈妈。
灵活性问题：若检索阶段拿到了足够丰富的信息，和query一起构建扔给LLM后，LLM的生成完全基于检索出的内容，并没有增加新生成的内容，变成了复读机。

Advanced RAG的目标是对Native RAG的效果做了进一步优化。

Advanced RAG

Advanced RAG重点聚焦在检索增强，也即优化Retrieval阶段。

增加了Pre-Retrieval预检索和Post-Retrieval后检索阶段。

Pre-Retrieval预检索

本阶段关注的重点是：优化索引结构和原始查询。

优化索引

目标是提高被索引内容的质量。这涉及五种主要策略：增强数据粒度、优化索引结构、添加元数据、对齐优化和混合检索。

增强数据粒度

粗粒度

例如文档分块chunk较大。

理论上粗粒度，能包含更多的相关信息。

但这是一把双刃剑，粗粒度也可能包含了很多无关的内容，而这些无关内容可能会给LLM的generation阶段带来额外的困扰。

细粒度

例如文档分块chunk较小。

细粒度会导致分块很多，给检索阶段增加了压力。

同时细粒度也不能保证能提供完整的语义信息。

旁白：

反正一刀切预制一个chunk大小肯定不行
能不能动态优化？不同doc有不同的chunk？

展开说说

【针对文本数据】数据粒度从细到粗包括：

Token
Phrase 短语
Sentence 句子
Proposition 命题
Chunk 分块
Doc 整个文档

以Proposition命题为检索单元。命题被定义为文本中的原子表达式，每个命题都封装了一个独特的事实片段，并以简洁、自包含的自然语言格式呈现。

这种方法目的是提高检索精度和相关性。

【针对知识图谱Knowledge Graph】，数据粒度从细到粗包括：

Entity 实体
Triplet 三元组
sub-Graph 子图

优化索引

Chunk策略

和数据粒度有一定关联性。

chunk可能导致句子截断，这会损坏语义完整性。

优化：

递归拆分split
滑动窗口
分层检索：在多检索基础上合并全局关联信息

（具体怎么做下回分解）

一个关键点：如何在语义完整性和上下文长度之间取得平衡。

Small2Big方法

使用句子做检索单元（这个是small）

使用前句和后句做上下文（这个是big）

元数据

例如chunk的元数据：

页码
文件名
作者
时间
类别

检索时可通过meta data先过滤，例如检索time range内的chunk，确保是新鲜的信息。

除了从原始文档中自动抽取meta data，也可以人工构建meta data，例如：

添加段落摘要
引入假设性问题

引入假设性问题

例如把doc喂给LLM，让LLM生成这个doc可以回答哪些问题。

在Retrieval时，对比原始query和LLM生成的这些假设性问题，可以用于过滤掉不相关的doc。

对齐优化

例如垂直领域，调优embedding模型，可以将领域内的相似知识嵌入到相近的空间（相比于通用embedding模型）。

混合检索

向量相似性检索
文本相似性检索
知识图谱检索

查询优化

查询优化就是让用户的原始问题更清晰，更适合于检索任务。

常见的方法包括查询改写、查询转换、查询扩展等。

查询扩展

将单个查询扩展为多个查询，丰富查询内容，可提供更丰富的上下文信息。

让LLM针对原始query生成多个查询
将复杂问题拆分成多个子问题

查询转换

改写用户的原始query

让LLM优化原始query
使用专门的较小的语言模型进行改写
让LLM先生成原始query的答案，然后将答案作为query，去根据相似性检索（而不是直接用原始query去检索）

Post-Retrieval后检索

重点是有效的融合检索到的相关内容和query。

主要方法包括：

分块chunk重排序
1. 将检索到的块里，最相关的块优先级提高
上下文压缩
1. 一个是避免prompt超长，超过LLM的窗口限制
2. 另一个是找到基础信息，强调关键信息，将不相关的内容压缩、精简、淡化

参考

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Hugo Lei 赏你了，我的一点心意

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。