RAG全景图：从RAG启蒙到高级RAG之36技，再到终章Agentic RAG！

最新推荐文章于 2024-09-08 15:12:17 发布

小天才学习机打游戏

最新推荐文章于 2024-09-08 15:12:17 发布

阅读量998

点赞数 29

文章标签：算法 transformer 深度学习人工智能机器学习

本文链接：https://blog.csdn.net/m0_59164520/article/details/141035981

版权

检索增强生成（RAG：Retrieval-Augmented Generation）技术可追溯到2020年Facebook发表的一篇论文：“Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks”。它结合了信息检索和生成模型技术，通过引入外部知识库信息，解决知识密集型NLP任务的效果：问答、文本摘要等。

大模型RAG之启蒙

大型语言模型（LLMs）虽然展现出了令人印象深刻的能力，但它们在处理特定领域或知识密集型任务时面临诸如产生幻觉（hallucination）、知识过时以及推理过程不透明和不可追溯等挑战。

RAG技术通过整合外部数据库中的知识，作为解决这些问题的有前途的方案。它增强了生成的准确性和可信度，特别是对于知识密集型任务，并允许持续的知识更新和整合特定领域的信息。

大模型RAG核心浓缩成两个核心阶段：

检索阶段：模型首先从外部知识库中检索与输入文本相关的信息。这个知识库可以是对大规模文本数据集进行索引处理后形成的数据库。

生成阶段：将检索到的信息作为输入，到一个生成模型中（如Llama3）。这个生成模型会基于输入信息，生成最终的响应或文本。

高级RAG之36技

从架构、模块、技术三个维度讲解了整个大模型高级RAG企业落地全过程之技术要点，一个框架、10个模块、36种技术！对一些复杂核心模块：分块、向量、重排也进行了系统性总结和概况！

Query理解（Query NLU）：使用LLM作为基础引擎来重写用户Query以提高检索质量，涉及Query意图识别、消歧、分解、抽象等，总计7种技术。

Query路由（Query Routing）：查询路由是LLM支持的决策步骤，根据给定的用户查询下一步该做什么，总计1种技术。

索引（Indexing）：是当前RAG中比较核心的模块，包括文档解析（5种工具）、文档切块（5类）、嵌入模型（6类）、索引类型（3类）等内容，总计8种技术。

Query检索（Query Retrieval）：重点关注除典型RAG的向量检索之外的图谱与关系数据库检索（NL2SQL），总计3种技术。

重排（Rerank）：来自不同检索策略的结果往往需要重排对齐，包括重排器类型（5种），自训练领域重排器等，总计3种技术。

生成（Generation）：实际企业落地会遇到生成重复、幻觉、通顺、美化、溯源等问题，涉及到RLHF、偏好打分器、溯源SFT、Self-RAG等等，总计7种技术。

评估与框架：RAG需要有全链路的评价体系，作为RAG企业上线与迭代的依据，总计3种技术。

RAG新技术：RAG未来将走向哪里？探讨未来的一些可能得方向，以及如何实现，总计3种技术。

一张全景框架图，梳理了10个模块，36种技术（原版图，可编辑）

终章之Agentic RAG

最终，大模型RAG问答终章是Agentic RAG!

向Lv2-智能体提出一个问题。``while (Lv2-智能体无法根据其记忆回答问题) {`    `Lv2-智能体提出一个新的子问题待解答。`    `Lv2-智能体向Lv1-RAG提问这个子问题。`    `将Lv1-RAG的回应添加到Lv2-智能体的记忆中。``}``Lv2-智能体提供原始问题的最终答案。

例如，Query：“与第五交响曲创作于同一世纪的交通工具是什么？”，Agent分两个子问题来解决：

第一个子问题：“第五交响曲是在哪个世纪创作的？”
第二个子问题：“19世纪发明的交通工具”

RAG全景图专栏学习方式

PaperAgent团队打造的RAG全景图专栏囊括70+张图，总计5万余字，专栏之配套包括专业技术交流群、RAG流程与架构图原稿（可自由编辑）等等，专栏之详情咨询：【留言区或私信】，备注：RAG专栏

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述