博客摘录「大模型的RAG(检索增强生成) ----大模型外挂」2024年5月10日

最新推荐文章于 2024-09-28 21:20:29 发布

张山 Sam²⁰²⁰

最新推荐文章于 2024-09-28 21:20:29 发布

阅读量337

点赞数 7

文章标签：笔记

本文链接：https://blog.csdn.net/weixin_48880463/article/details/138678319

版权

如何使用RAG3.1 RAG技术原理 RAG 结合了信息检索和文本生成两种方法，旨在突破传统问答系统的局限。通过将外部数据检索的相关信息输入大语言模型，大语言模型能够基于这些信息生成回答，进而增强答案生成的能力。RAG 主要有两个核心组件：信息检索和文本生成。信息检索（Retrieve）的主要任务是在一个大型的知识库或文档集合中搜索与用户提出的问题相关的信息。这个过程类似人在图书馆中查找相关书籍以回答某个问题。通常，这一步骤依赖传统的信息检索技术，如倒排索引、TF-IDF 评分、BM25 算法等，或者采用更现代的基于向量的搜索方法。文本生成（Generate）的职责是根据检索到的信息生成一个连贯、准确的回答。这个过程可以看作根据收集到的材料撰写一篇简短的文章或回答。这个功能通常采用预训练的生成式语言模型来实现，如 GPT 、LLama系列。仅加载外部文件是不够的。通常，外部文件非常大，而且 Embedding 模型和大语言模型都有长度限制，这时就需要将文件进一步切割成文本块（Chunk），才能精准地进行检索和生成。根据索引方式的不同、模型选择的不同，以及问答文本长度和复杂度的不同，切割的方法也有不同。3.2 RAG工作流程检索：将用户的查询通过嵌入模型转化为向量，以便与向量数据库中的其他上下文信息进行比对。通过这种相似性搜索，可以找到向量数据库中最匹配的前 k 个数据。增强：将用户的查询和检索到的额外信息一起嵌入到一个预设的提示模板中。生成：最后，这个经过检索增强的提示内容会被输入到大语言模型 (LLM) 中，以生成所需的输出。3.2.1 最基础的RAG流程接收查询：系统收到用户的问题或查询。检索相关信息：系统查询一个或多个外部知识库，查找与该问题相关的信息或文档。生成回答：大语言模型利用检索到的信息和用户的原始查询生成回应。这个过程不是仅复制检索到的信息，而是根据用户的具体问题创造性地生成回应。提供回应：系统将生成的回答呈现给用户。