【AI大模型】RAG 架构设计三阶段演进之路

第一阶段:Naive RAG 架构设计

大型语言模型(LLMs)虽然展现出卓越的性能,但在处理特定领域或知识密集型任务时,存在一些挑战,比如:产生虚假信息、知识陈旧以及推理过程的非透明性和不可追溯性。RAG 技术作为一种有希望的解决方案,通过融合外部数据库的知识,有效应对了这些问题。它显著提升了生成内容的准确性和可靠性,尤其在知识密集型任务中表现突出,并支持知识的持续更新及特定领域信息的整合。

大模型 Naive RAG 的运作可概括为以下两个关键阶段:

在这里插入图片描述

检索阶段:大模型首先在外部知识库中搜寻与输入文本相关的信息。该知识库通常是由大规模文本数据集经过索引处理后形成的数据库。

生成阶段:将检索到的信息送入生成模型(比如:GPT-4o)。该生成大模型会根据这些信息,生成最终的回答或文本内容。

在这里插入图片描述

第二阶段:Advanced RAG 架构设计

大模型 Advacned RAG 技术在企业应用中的落地全流程,涵盖了架构、模块、技术三大方面,形成了一套完整的框架,包含10个关键模块和36项技术要点!对于一些关键且复杂的模块,比如:分块、向量化、重排等,也进行了全面总结和概述。

在这里插入图片描述

Query 理解(Query NLU):利用 LLM 作为核心引擎,对用户 Query 进行改写以提升检索效果,涉及意图识别、歧义消除、Query 分解、抽象等七个技术点。

Query 路由(Query Routing):查询路由是 LLM 支持的关键决策环节,决定了用户查询的下一步行动,包含一项核心技术。

索引(Indexing):作为 RAG 中的核心模块,索引包括文档解析(五种工具)、文档切块(五类方法)、嵌入模型(六种类型)、索引类型(三种分类)等,共计八项技术。

Query 检索(Query Retrieval):除了 Naive RAG 向量检索外,还关注图谱和关系数据库检索(NL2SQL),共涉及三项技术。

重排(Rerank):不同检索策略的结果需要通过重排来优化,包括重排器类型(五种)和自训练领域重排器等,共计三项技术。

生成(Generation):在企业应用中,生成环节可能会遇到重复、幻觉、流畅性、美化、溯源等问题,涉及 RLHF、偏好打分器、溯源 SFT、Self-RAG 等七项技术。

评估与框架:RAG 需要一个全链路的评价体系,作为企业上线和迭代的依据,包括三项技术。

RAG 新技术:探讨 RAG 未来的发展方向及实现路径,共提出三项潜在的新技术。

第三阶段:Agentic RAG 架构设计

最终,大模型 RAG 问答终章是 Agentic RAG!

向Lv2-智能体提出一个问题。
while (Lv2-智能体无法根据其记忆回答问题) {
    Lv2-智能体提出一个新的子问题待解答。
    Lv2-智能体向Lv1-RAG提问这个子问题。
    将Lv1-RAG的回应添加到Lv2-智能体的记忆中。
}
Lv2-智能体提供原始问题的最终答案。

比如:Query:“与第五交响曲创作于同一世纪的交通工具是什么?”,Agent 通过规划能力分两个子问题来解决:

  • 第一个子问题:“第五交响曲是在哪个世纪创作的?”

  • 第二个子问题:“19 世纪发明的交通工具是什么?”

    在这里插入图片描述

最后的最后

感谢你们的阅读和喜欢,我收藏了很多技术干货,可以共享给喜欢我文章的朋友们,如果你肯花时间沉下心去学习,它们一定能帮到你。

因为这个行业不同于其他行业,知识体系实在是过于庞大,知识更新也非常快。作为一个普通人,无法全部学完,所以我们在提升技术的时候,首先需要明确一个目标,然后制定好完整的计划,同时找到好的学习方法,这样才能更快的提升自己。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

大模型知识脑图

为了成为更好的 AI大模型 开发者,这里为大家提供了总的路线图。它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
在这里插入图片描述

经典书籍阅读

阅读AI大模型经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验。对于想要深入学习AI大模型开发的读者来说,阅读经典书籍是非常有必要的。

在这里插入图片描述

实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

面试资料

我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下

在这里插入图片描述

640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值