AI大模型RAG架构详细解析（二）自我型RAG、自适应型RAG、REFEED、REALM、RAPTOR

最新推荐文章于 2025-06-13 10:17:23 发布

大模型面试

最新推荐文章于 2025-06-13 10:17:23 发布

阅读量675

点赞数 10

文章标签：大模型 LLM ai 人工智能大模型入门 RAG

本文链接：https://blog.csdn.net/Code1994/article/details/148424319

版权

六、自我型RAG：反思型思考者

自我型RAG并不总是求助于知识库。相反，它首先使用自己的先前输出作为检索基础，然后再寻求外部帮助。

核心特点

使用内部输出进行迭代细化。
提高连贯性和一致性。
减少不必要的检索。

应用场景

需要在各章节中保持叙事连贯性的长篇故事创作人工智能。

实践项目

学术研究评论助手

构建一个帮助学生或研究人员审查学术论文的助手。该代理检索相关作品，反思证据是否支持或反驳论文的主张，并生成评论或摘要。该代理需要自我评估检索到的来源是否足够相关或矛盾，并据此细化其输出。

人工智能政策的伦理风险分析器

开发一个评估提议的人工智能伦理政策（例如，面部识别规则）的系统。该代理检索案例研究、研究和新闻示例，然后反思其使用的证据中的差距或偏见，以进行评估。伦理评估需要细微差别。反思循环允许该代理重新考虑其检索是否公平地代表了政策问题的双方，并重新生成具有平衡来源的输出。

七、自适应型RAG：每次检索都智能

并非所有问题都需要检索。自适应型RAG使用置信度分数来决定何时检索，何时不需要。

核心特点

使用内部模型信号触发检索。
平衡记忆与外部知识。
使用“诚实探针”避免幻觉。

应用场景

虚拟医疗助手仅在复杂病例时咨询数据库，而使用内部记忆回答简单问题。

实践项目

企业帮助台优化器

构建一个智能帮助台系统，用于内部IT团队，根据用户的角色和查询类型调整其检索方法。例如，当开发运维工程师询问有关容器错误的问题时，触发技术日志/文档检索；而新员工询问有关VPN访问的问题时，则触发常见问题和入职资料。自适应型RAG检测用户上下文，并相应地调整检索层——对于常规查询，拉取最少的用户特定文档；对于复杂问题，则拉取更深入的技术工件。

自适应临床决策支持工具

创建一个为医生量身定制的工具，根据患者症状的严重性和模糊性调整其医疗信息检索。对于常规诊断，它从临床指南中拉取信息；对于模糊或罕见病例，它扩展到学术研究、临床试验和专家访谈。不同病例需要不同深度的证据。自适应型RAG确保检索具有上下文敏感性——足够智能，能够根据需要扩展或缩小信息范围。

八、REFEED（检索反馈）：无需训练即可微调

REFEED通过优化检索而非重新训练模型来提升回答质量。

核心特点

根据检索后信号重新排序答案。
结合检索前和检索后内容。
迭代改进输出。

应用场景

企业搜索引擎通过观察用户点击或高度评价的文档来持续改进。

实践项目

智能招聘面试助手

构建一个帮助人力资源专业人士进行结构化面试的人工智能工具。当助手提问或回答问题时，它从用户更正（例如，“这不是正确的政策”或“这是过时的”）中学习，并相应调整未来的检索——浮出更相关的内部文件、政策更新或候选人评估标准。该系统无需全面重新训练；它只是根据反馈更新检索和重新排序信息的方式。随着时间的推移，助手变得更好，能够与每个人力资源团队的独特风格和政策变化保持一致。

具有用户更正功能的自适应编码助手

创建一个编码助手，它从论坛、文档和过往项目中检索信息，以建议代码片段和架构模式。当开发人员对建议进行负面评价或重写时，助手使用该反馈来调整其未来的检索行为——优先考虑更新的框架、更高质量的示例或企业特定的代码。它无需重新训练LLM即可实现快速个性化。检索行为通过反馈演变，以一种轻量级、非侵入式的方式逐步改进。

九、REALM：检索感知型语言建模

REALM是一种混合型生物——在预训练期间使用掩码语言建模训练检索器。

核心特点

在训练期间使用维基百科规模的语料库。
使用最大内积搜索（MIPS）训练检索器。
非常适合开放域问答。

应用场景

能够使用潜在文档表示“预先思考”答案的搜索感知型助手，例如谷歌助手。

实践项目

基于新闻档案的长篇传记生成器

创建一个能够通过检索和整合新闻档案、采访和文章中的相关文档来生成公众人物详细传记的助手。以REALM的方式对其进行训练，使其能够学习对人物故事重要的检索模式——时间顺序、事件重要性以及名称消歧。该项目从预训练模型中受益，使其能够识别不仅要检索什么，还要了解检索到的上下文如何塑造长篇叙事结构——这是REALM专门设计来处理的。

基于领域的医学问答系统

构建一个针对医学专业人士的问答系统，该系统使用REALM风格的训练技术——将从临床文献中的检索深度嵌入模型的语言建模管道。这不仅使其能够检索相关研究，还能在回答生成过程中理解其医学上下文。由于REALM在训练期间整合检索，该系统发展出对何时以及如何检索的细微理解，使其非常适合像医学这样受监管的领域，其中证据必须具有上下文相关性和精确性。

十、RAPTOR：基于树的推理

想象一下思维导图——这就是RAPTOR。它将内容聚类成一个分层树，用于多级检索——顶层是宽泛的主题，底层是具体细节。

核心特点

高效回答分层、复杂问题。
提供树遍历或折叠树模式。
在处理细微任务时优于平面检索。

应用场景

法律研究机器人通过从抽象到详细的分支检索法规和具体案例细节。

实践项目

复杂金融风险评估代理

构建一个帮助分析师评估投资风险的人工智能代理，通过将查询分解为多个子因素（例如，市场波动、监管变化、公司基本面）来引导检索。RAPTOR沿着每条路径（例如，央行新闻、行业报告、财务报表）引导检索，然后将它们综合成一个总体风险评估。金融风险是多方面的，从并行证据分支进行推理受益匪浅。RAPTOR确保在最终综合之前深入探索每个组成部分。

人工智能辩论教练

创建一个帮助辩论学生构建论点的工具，通过将论题（例如，“人工智能应该受到监管”）分解为子主题，如伦理影响、法律框架和经济影响。该系统为每个分支检索论点和反论点，帮助学生准备平衡且高质量的辩论要点。辩论准备需要在多个往往是相反的维度上进行推理。RAPTOR的树结构检索和推理帮助代理构建更强的多视角论点。