LLM——检索增强生成RAG

bulingg

已于 2023-12-28 19:36:54 修改

阅读量730

点赞数 17

分类专栏：算法工程师文章标签：算法

于 2023-12-28 19:33:42 首次发布

本文链接：https://blog.csdn.net/bulling/article/details/135276515

版权

8 篇文章 0 订阅

订阅专栏

定义

RAG 是一种结合了检索（Retrieval）和生成（Generation）的自然语言处理技术。它旨在通过先从一个大型的文档数据库中检索相关信息，然后基于检索到的信息生成回答或内容，从而增强语言模型的能力。

检索阶段：当给定一个问题或者提示时，RAG首先会在一个大规模的知识库中检索出相关的文档或者数据片段。
增强阶段：将检索到的信息整合进生成过程，以此来提升生成内容的相关性和准确性。这个过程是RAG的核心特性，因为它使得生成的文本不仅仅依赖于模型内部的知识，而是能够动态地利用最新的、具体的外部信息。
生成阶段：将检索到的信息作为上下文输入到一个预训练的语言生成模型中，这个模型会生成一个精炼并且与上下文相关的回答或者文本。

检索：使用用户的查询来从外部知识源检索相关上下文。为此，需要用嵌入模型将用户查询嵌入到与向量数据库中额外上下文相同的向量空间。这样就可以进行相似性搜索，从向量数据库中返回最接近的前k个数据对象。
增强：将用户查询和检索到的额外上下文放入一个提示模板中。
生成：最后，将增强后的提示输入到大型语言模型（LLM）中进行生成。

检索准确性：RAG的性能很大程度上依赖于检索阶段的准确性，如果检索到的信息不相关，生成的内容可能会偏离主题。

效率问题：由于需要进行检索操作，RAG可能在响应时间上不如纯生成模型快。

RAG通过结合检索，增强和生成，为语言模型提供了一种有效的方式来利用大规模的外部知识库，从而提高模型在特定任务上的表现和生成的内容质量。

关注