全面理解与实战 RAG 技术：原理剖析 + LangChain + LlamaIndex + Rerank 最佳实践

未名编程

已于 2025-05-14 10:18:55 修改

阅读量735

点赞数 13

分类专栏：人工智能 RAG 技术详解文章标签： langchain

于 2025-05-14 08:57:19 首次发布

本文链接：https://blog.csdn.net/qq_44275213/article/details/147940349

版权

RAG 技术详解同时被 2 个专栏收录

6 篇文章 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

人工智能

10 篇文章

订阅专栏

📌 引言：为什么我们离不开 RAG？

随着大语言模型（LLM）在各类场景中崭露头角（如 ChatGPT、通义千问等），我们发现它们强大却又受限：

问题	描述
知识截止	模型知识固定于训练时间，例如 2023-10 前
内容幻觉	模型生成听起来合理但实则错误的内容
用户定制	企业私有知识无法注入预训练模型中

这时，RAG（Retrieval-Augmented Generation）诞生了：结合检索系统与生成模型，将“记忆外”知识动态接入，成为大模型的记忆外挂。

一、RAG 本质原理详解

1.1 什么是 Retrieval-Augmented Generation？

RAG 是一种 生成前先“查资料”的方法，由 Facebook AI（现 Meta）在 20

了解本专栏

订阅专栏解锁全文

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

未名编程

关注关注

13
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

订阅专栏

RAG技术深度解析：从原理到企业级应用实战

maxcode

03-15

175

根据微软2023年技术报告，引入RAG后模型在金融风控场景的幻觉率降低至3.2%。RAG（检索增强生成）通过动态接入外部知识库，将检索与生成能力融合，使模型具备。实验数据显示，引入重排序后问答准确率提升17.3%。

【书生·浦语大模型实战营】学习笔记（三）：“茴香豆” 搭建你的RAG 智能助理

专注大数据与人工智能技术分享，欢迎私信加群互相学习！

04-12

1355

本篇笔记内容主要分为RAG理论介绍和“茴香豆” RAG 智能助理实战。前半部分对RAG流程、向量数据库、优化等展开介绍，后半部分实战任务分为以web页面及Internlm框架进行茴香豆实战，欢迎大家交流学习！

参与评论您还未登录，请先登录后发表或查看评论

构建智能问答系统：LlamaIndex与RAG技术结合的最佳实践

m0_65555479的博客

11-27

1435

上一篇文章[检索增强生成 Retrieval-Augmented Generation]介绍了什么是 RAG ，并详细对比了和大模型微调方式的区别。目前实现 RAG 的主流框架就是 [LangChain]和 [LlamaIndex]，LangChain 更适合需要复杂对话流程、上下文管理、以及多步骤任务的应用场景，如聊天机器人、任务自动化等。LlamaIndex 当应用场景主要涉及大量数据的快速检索和查询时，LlamaIndex更加适用，如企业知识问答系统、文档搜索引擎等。

RAG知识库问答LangChain+LLM的二次开发：商用时的典型问题及其改进方案_langchain rag 知识库

python1222_的博客

07-02

1164

如之前的文章所述，我司下半年成立大模型项目团队之后，我虽兼管整个项目团队，但为让项目的推进效率更高，故分成了三大项目组(不过到了24年Q1之后，则有了AIGC、论文、RAG、机器人、agent等五大项目组了第一项目组由霍哥带头负责类似AIGC模特生成系统第二项目组由阿荀带头负责论文审稿GPT第三项目组由朝阳带头负责企业多文档的知识库问答系统，朝阳、猫药师、bingo等人贡献了本文的至少一半对于知识库问答，现在有两种方案，一种基于llamaindex，一种基于langchain +LLM。

【保姆级教程】本地私有化RAG知识库搭建：基于Ollama+AnythingLLM的详细指南

m0_63171455的博客

12-30

1万+

检索增强生成（Retrieval-Augmented Generation，RAG）是一种结合了信息检索和语言模型的技术，它通过从大规模的知识库中检索相关信息，并利用这些信息来指导语言模型生成更准确和深入的答案。这种方法在2020年由Meta AI研究人员提出，旨在解决大型语言模型（LLM）在信息滞后、模型幻觉、私有数据匮乏和内容不可追溯等问题。即：RAG 就是可以开卷回复的 LLM‍。

小白学RAG：大模型 RAG 技术实践总结

2301_78285120的博客

06-22

1950

RAG (Retrieval-Augmented Generation) 是一种结合信息检索与生成模型的技术。其主要目标是通过检索大量信息并使用生成模型进行处理，从而提供更加准确和丰富的回答。RAG技术在处理大规模文本数据时表现尤为出色，能够从海量信息中迅速找到相关内容并生成合适的响应。智谱RAG方案具体设计了如何将RAG技术应用到智能客服领域。方案包括以下几个关键环节：信息检索模块：从预先构建的知识库中快速找到与用户问题相关的内容。

大模型RAG实战：结合BM25与向量检索的LlamaIndex实现

2401_84494441的博客

10-17

1568

目前，大模型RAG系统中普遍采用混合检索来提升检索准确性。针对要回答的问题，同时通过。

使用 LlamaIndex 框架搭建 RAG 应用基础实践

2401_84204207的博客

07-21

1275

LlamaIndex 默认是使用OpenAI的 gpt-3.5-turbo 模型，当然你得提供, 由于众所周知的原因，用起来不是很方便。因此可以使用OpenAILike这个类来使用我们自己的本地模型，参考文档。我这边用的模型是，然后用vllm启动之后，就可以初始化类了，这里要提前安装这个包。api_key="EMPTY", # vllm 启动时没有配置，默认就是 EMPTYapi_base="http://192.168.0.1:7859/v1", # 启动 vllm 的ip地址。

从零实现本地知识库问答——实战基于OCR和文本解析器的新一代RAG引擎：RAGFlow(含源码剖析)

热门推荐

结构之法算法之道

04-13

1万+

继InfiniFlow于去年年底正式开源 AI 原生数据库 Infinity 之后，InfiniFlow的的端到端 RAG 解决方案 RAGFlow 也于近期正式开源是的，你没看错，这3个看起来很不性感的地方，恰恰是目前许多 LLM 没有做好的。伴随着长上下文 LLM 的升级，特别是针对长上下文“大海捞针”能力的提升，极大缓解了 RAG 实施中的痛点之一 —— 来自 LLM 自身的问题而另一大问题就是来自 RAG 系统本身，这包含：数据库的问题。多路召回对于 RAG还挺重要的。

RAG理论到实践：高级、模块化RAG在AI工程架构中的行业通用解决方案与实施策略(Advanced RAG✨)

python12222_的博客

09-18

1166

词汇解释说明embedding嵌入（embedding）是指将高维数据映射为低维表示的过程。在机器学习和自然语言处理中，嵌入通常用于将离散的符号或对象表示为连续的向量空间中的点。在自然语言处理中，词嵌入（word embedding）是一种常见的技术，它将单词映射到实数向量，以便计算机可以更好地理解和处理文本。通过词嵌入，单词之间的语义和语法关系可以在向量空间中得到反映。VectorDB向量数据库是一种特殊类型的数据库，它可以存储和处理向量数据。

大模型外挂知识库rag综述

posuosini的博客

03-19

9288

大模型外挂知识库rag的综述

书生大模型第四期笔记:Prompt/RAG/XTuner微调/Agent/LMDeploy量化部署...

m0_53632564的博客

11-07

1263

远程连接的好处就是，如果你使用的是远程办公，你可以通过SSH远程连接开发机，这样就可以在本地进行开发。是一种网络技术，它可以将外网中的任意端口映射到内网中的相应端口，实现内网与外网之间的通信。这条命令会通过开发机 SSH 通道将开发机内的 {开发机_PORT} 转发到您本地机器的 (本地机器_PORT}，这个过程可能会要求你输入 SSH 链接的密码。组成，为建立安全的 SSH 通道，双方需要先建立 TCP 连接，然后协商使用的版本号和各类算法，并生成相同的。，我们使用本地连接访问，解决这个代理问题。

【大模型从入门到精通19】开源库框架LangChain LangChain文档加载器1

kaggle expert，全球排名前1000，清华计算机研究生，兴趣算法工程

08-13

1712

在数据驱动的应用领域，特别是涉及对话界面和大型语言模型（LLM）的应用中，从各种来源高效加载、处理并与数据进行交互的能力至关重要。这些加载器擅长处理来自公共源的数据，如 YouTube、Twitter 和 Hacker News，同时也适用于来自专有源的数据，如 Figma 和 Notion。保存清洗后的文本：可选地，脚本可以将清洗和分词后的文档文本保存到文件中。这个扩展的代码提供了一个更全面的示例，展示如何从加载和清洗文本到基本分析和处理特殊情况，对 PDF 文档进行程序化的处理。

毕业设计-客服系统-整站商业源码.zip

05-16

毕业设计-客服系统-整站商业源码.zip

软考初级信息处理技术员(上机)下午试题模拟17及答案.docx

05-16

软考初级程序员相关文档

毕业设计-砍价宝7.2.0开源-整站商业源码.zip

05-16

毕业设计-砍价宝7.2.0开源-整站商业源码.zip

05-16

05-16

数据集介绍：多类别动物目标检测数据集一、基础信息数据集名称：多类别动物目标检测数据集图片数量： - 训练集：6,860张图片 - 验证集：1,960张图片 - 测试集：980张图片总计：9,800张含动态场景的动物图像分类类别： Alpaca（羊驼）、Camel（骆驼）、Fox（狐狸）、Lion（狮子）、Mouse（鼠类）、Ostrich（鸵鸟）、Pig（猪）、Rabbit（兔子）、Rhinoceros（犀牛）、Shark（鲨鱼）、Sheep（绵羊）、Snake（蛇）、Whale（鲸鱼）标注格式： YOLO格式标注，包含目标检测所需的归一化坐标及类别索引，适用于YOLOv5/v7/v8等系列模型训练。数据特性：覆盖航拍、地面视角等多种拍摄角度，包含动态行为捕捉及群体/单体目标场景。二、适用场景野生动物监测系统：支持构建无人机/红外相机AI识别系统，用于自然保护区动物种群追踪与生态研究。智慧农业管理：适用于畜牧养殖场动物行为分析、数量统计及健康监测等自动化管理场景。生物多样性研究：为陆地/海洋生物分布研究提供标注数据支撑，助力濒危物种保护项目。教育科研应用：可作为计算机视觉课程实践素材，支持目标检测、迁移学习等AI教学实验。三、数据集优势跨物种覆盖全面：包含13类陆生/水生动物，涵盖家畜、野生动物及濒危物种，支持复杂场景下的模型泛化训练。动态场景丰富：捕捉动物运动、群体互动等真实行为模式，提升模型对非静态目标的检测鲁棒性。标注体系规范：严格遵循YOLO标注标准，提供精确的边界框定位，支持即插即用的模型训练流程。多场景适配性：数据来源涵盖航拍影像、地面监控等多维度视角，适用于农业、生态保护、科研等跨领域应用。类别平衡优化：通过分层抽样保证各类别数据分布合理性，避免长尾效应影响模型性能。

三菱FX5U与英威腾GD变频器Modbus通讯程序及应用详解工业自动化三菱FX5U与英威腾GD变频器Modbus通讯程序(含注释与参数设置)

05-16

内容概要：本文详细介绍了如何利用三菱FX5U PLC与三台英威腾GD变频器进行Modbus通讯的具体实现方法。主要内容涵盖硬件连接、参数设置、程序逻辑以及常见问题解决。文中提供了详细的接线图、参数配置步骤、关键代码片段，并分享了一些实用的经验技巧。此外，还特别强调了通讯稳定性的重要性和一些容易忽视的技术细节。适合人群：自动化控制系统工程师、工业通信技术人员、PLC编程人员。使用场景及目标：适用于需要将三菱FX5U PLC与多台英威腾GD变频器集成的应用场景，如工厂自动化生产线、机械设备控制等。主要目的是实现对变频器的远程频率设定、启停控制及状态监测，确保系统的高效稳定运行。阅读建议：读者可以先了解整个项目的背景和技术选型原因，然后重点研读具体的硬件连接方式、参数配置要点和程序逻辑设计思路。对于初学者来说，建议跟随文中的步骤逐步实践，同时注意作者提到的各种注意事项和避坑指南。

rag+langchain

12-26

### 关于RAG与LangChain的集成 #### RAG简介检索增强生成(Retrieval-Augmented Generation, RAG)是一种结合了信息检索和自然语言生成的技术，旨在提高模型对于特定领域或情境下的响应质量。该技术允许机器学习模型不仅依赖预训练的数据集，还能动态地从外部资源中获取最新、最相关的信息来辅助生成更加精准的回答。 #### LangChain的作用 LangChain作为一种强大的工具，在支持LLM(大语言模型)应用开发方面表现突出[^2]。它提供了丰富的API接口和服务，使得开发者可以轻松实现复杂的逻辑处理流程，并且能够有效地管理不同类型的输入输出转换过程。特别值得注意的是其对多种场景的支持能力——无论是简单的问答系统还是涉及多轮交互的任务导向型对话都可以得到很好的适配和支持。 #### 集成方法概述为了将RAG理念融入基于LangChain的应用程序之中，通常会遵循以下几个原则： - **数据源接入**：确保有稳定可靠的数据库或其他形式的知识库作为支撑，以便在运行时提供必要的背景资料给到下游模块； - **索引机制建立**：针对所选中的文档集合创建高效的全文搜索引擎或者向量相似度匹配服务； - **查询解析优化**：设计合理的算法用于理解用户的意图并将之转化为有效的搜索条件； - **结果融合策略制定**：当获得多个候选片段之后，需考虑如何合理组合它们从而形成连贯完整的回复内容。下面给出一段Python代码示例展示了一个简化版的RAG工作流是如何利用LangChain完成上述功能点的： ```python from langchain import LangChainClient import json def rag_with_langchain(user_query): client = LangChainClient(api_key="your_api_key_here") # Step 1: Parse user query into search terms. parsed_terms = parse_user_input(user_query) # Step 2: Retrieve relevant documents from external sources using LangChain's API. retrieved_docs = [] for term in parsed_terms: response = client.search_documents(query=term) docs = json.loads(response.text)['documents'] retrieved_docs.extend(docs[:3]) # Limit to top 3 results per term. # Step 3: Generate final answer based on retrieved information. context = " ".join([doc['content'] for doc in retrieved_docs]) generated_answer = generate_response(context=context, question=user_query) return generated_answer # Dummy implementations of helper functions used above. def parse_user_input(input_string): words = input_string.split() important_words = [word for word in words if not word.lower() in STOPWORDS] return [" ".join(important_words[i:i+2]) for i in range(len(important_words)-1)] def generate_response(context, question): prompt = f"Given this context:\n{context}\nAnswer the following question:{question}" llm_client = LangChainClient(api_key="your_api_key_here") result = llm_client.generate_text(prompt=prompt) return result.generated_text ``` 此段伪代码展示了如何通过调用LangChain所提供的API来进行基本的RAG操作。实际项目可能会涉及到更多细节上的调整以及性能方面的考量。