LangChain4j-RAG高级-核心概念

最新推荐文章于 2024-08-10 18:25:50 发布

Box_clf

最新推荐文章于 2024-08-10 18:25:50 发布

阅读量809

点赞数 11

分类专栏： AI Agent 文章标签： langchain LangChan4j 人工智能 RAG

本文链接：https://blog.csdn.net/box_clf/article/details/140744983

版权

AI Agent 专栏收录该内容

8 篇文章 1 订阅

订阅专栏

RetrievalAugmentor整体概念

简单总结一下

LangChain4j中对于RetrievalAugmentor这里官方描述的比较模糊, 只在 DefaultRetrievalAugmentor章节给出来了一个灵感来源的文章(LangChain框架中的设计思路)和一个研究报告, 有兴趣可以看一下:

通常，RAG 系统涉及：确定要检索哪些信息的问题（通常来自用户）、从数据源（或多个数据源）检索信息的过程以及将检索到的信息直接传递到LLM作为提示的一部分。

这里的设计理念就是将用户的提问进行转换为具体的子问题，再根据子问题的描述路由到不同的数据源进行检索，将检索的内从进行重新合并达到检索增强的结果，最后再根据检索内容来回答用户的问题。

下面是具体的一些设计理念。

Query Transformations 查询转换

考虑 RAG 时要问的第一个问题：我们如何才能使RAG系统对用户输入的不同问题的回答具有健壮性？例如，对于具有挑战性的检索任务，用户问题的措辞可能很糟糕。查询转换是一组专注于修改用户输入以改进检索的方法。

Query expansion 查询扩展

查询扩展将输入分解为子问题，每个子问题都是一个更狭窄的检索挑战。多查询检索器执行子问题生成、检索，并返回检索到的文档的唯一并集。 RAG 融合通过对每个子问题返回的文档进行排名来构建。后退提示提供了第三种方法，即生成后退问题，以更高层次的概念或原则为答案综合奠定基础。

一种称为“后退”提示的提示技术可以通过首先提出“后退”问题来提高复杂问题的表现。这可以与常规问答应用程序结合起来，然后对原始问题和后退问题进行检索。

例如, 用户提出的一个物理问题, 可以退回到一个物理原理的问题(LLM生成的回答)，再进一步根据原理的问题和用户的原始问题来进行回答。

“后退”问题示例:

考虑一下这个问题：“红袜队和爱国者队谁最近赢得了冠军？”提出两个具体的子问题可以帮助回答这个问题：