2024-06-19 问AI: 在LLM中，RAG是什么？

bigshark_software

已于 2024-06-19 11:35:30 修改

阅读量870

点赞数 13

分类专栏：用AI来理解AI 文章标签：人工智能

于 2024-06-19 11:35:21 首次发布

本文链接：https://blog.csdn.net/baidu_24377669/article/details/139798109

版权

用AI来理解AI 专栏收录该内容

92 篇文章 0 订阅

订阅专栏

文心一言

在LLM（大型语言模型）中，RAG全称为Retrieval-Augmented Generation，即检索增强生成。以下是关于RAG的详细解释：

基本概念：
- RAG是一种通过检索LLMs之外的数据源来支持其生成答案的技术。
- 它结合了搜索和LLM提示，根据用户的查询要求，LLMs使用搜索算法从外部数据源获取上下文信息，并将查询和检索到的上下文合成后送入到LLM的提示中。
主要作用：
- RAG旨在帮助LLMs解决在实际应用中面临的挑战，如幻觉现象（即LLM可能会产生不准确或不相关的内容）、知识更新缓慢以及决策过程不透明等问题。
- 它通过外挂其他数据源（如外部向量数据库、外部知识图谱、文档数据、WEB数据等）来增强LLMs的能力，提供更新的、实时的信息，确保模型对新兴事实和领域内的最新发展有所了解。
技术实现：
- RAG的实现涉及数据加载、向量化、存储、召回和生成等步骤。首先，通过Doc Loader加载各种数据源的数据，并将其向量化后存储进向量数据库。当用户向LLM提问时，系统会从向量数据库中召回与问题相似度较高的上下文，与问题一起送入LLM生成答案。
RAG的发展范式：
- 目前，RAG的发展可以分为三种范式：Naive RAG、Advanced RAG和Modular RAG。每种范式都有其特定的实现方式和应用场景。
RAG的优势：
- RAG能有效地结合LLMs的参数化知识和非参数化的外部知识库，提高答案的准确性，减少模型的幻觉现象。
- 它促进了知识更新和特定领域知识的引入，使LLMs能更好地适应不同的应用场景。

总之，RAG是一种重要的技术，通过检索增强生成的方式，显著提升了LLMs在实际应用中的性能和准确性。

智谱清言

RAG (Relation-Augmented Graph) 是一种在大型语言模型（LLM）中用于提升知识推理能力的技术。它通过在图神经网络（GNN）中加入关系增强的机制，使得模型能够更好地理解和推理文本中的知识关系。具体来说，RAG 通过将知识图谱中的关系嵌入与文本嵌入相结合，使得模型能够利用预先定义好的知识关系来增强语言理解的准确性。

在RAG模式中，每个实体和关系都被表示为嵌入向量，这些向量在图结构中通过GNN进行交互。这种结构允许模型捕捉实体之间的复杂关系，并在需要时利用这些关系来进行更精准的推理。例如，在处理一个需要根据已知事实推导新结论的问题时，RAG 可以帮助模型识别和利用相关的事实和关系，从而提高推理的准确性。

在爱数AnyDATA框架中采用RAG模式，意味着该框架利用了这种关系增强图神经网络的技术，以低成本的方式帮助企业实现领域化和私有化的智能升级。通过这种方式，企业能够将大型模型更安全、更经济地应用于特定的行业应用场景，从而加强数据驱动的决策过程，推动智能化转型。

豆包

在 LLM 中，RAG 是检索增强生成（Retrieval Augmented Generation）的缩写，它是一种结合了检索和生成的自然语言处理模型架构。

RAG 为大型语言模型（LLMs）提供了从某些数据源检索到的信息，以此作为生成答案的基础。简而言之，RAG 是搜索+LLM 提示的结合，即在有搜索算法找到的信息作为上下文的情况下，让模型回答提出的查询。查询和检索到的上下文都被注入到发送给 LLM 的提示中。

RAG 通常包括以下步骤：

切分和向量化：将文本分割成块，并使用基于 Transformer decoder 的模型将这些块嵌入到向量中。
索引构建：将所有向量放入一个索引中。
提示生成：为 LLM 创建一个提示，告诉模型在搜索步骤中找到的上下文中回答用户的查询。
查询执行：使用相同的编码器模型将用户的查询向量化，然后对索引执行这个查询向量的搜索，找到前 k 个结果。
答案生成：从数据库中检索相应的文本块，并将它们作为上下文输入到 LLM 的提示中，生成答案。

RAG 已成为 LLM 系统中受欢迎的架构，它可以提高生成内容的相关性和质量，缓解幻觉问题，并能够利用外部知识源。许多产品几乎完全基于 RAG 构建，包括将网络搜索引擎与 LLM 相结合的问答服务，以及数百种与数据聊天的应用程序。

讯飞星火

在大型语言模型（LLM）中，RAG指的是检索增强生成（Retrieval-Augmented Generation）。

RAG是作为一种解决传统大模型在处理专有数据和快速更新知识方面的不足而提出的解决方案。其核心在于将外部的知识引入大模型中，使模型在生成回答时能够参考这些外部信息，从而提升准确性并减少模型幻觉的产生。这种技术通过将事实知识存储在外部知识源中，使得这些知识可以方便地进行更新和维护，而不需要进行繁琐的模型重新训练。

通义

在人工智能（AI）和自然语言处理（NLP）领域，RAG代表“检索增强生成”（Retrieval-Augmented Generation）。它是作为一种高级架构设计提出的，旨在结合检索式模型和生成式模型的优点，以改善大型语言模型（LLM）的性能。

大型语言模型如GPT系列虽然在生成连贯、类似人类的文本方面表现出色，但它们可能在提供精确、上下文相关的回复上遇到挑战，尤其是当需要依赖于具体事实或专业知识时。RAG通过以下方式解决这一问题：

检索过程：RAG首先使用一个检索模型从一个庞大的文档集合、知识库或预先索引的信息中检索与输入查询最相关的信息片段。这个步骤确保了模型可以访问到具体和可靠的信息来源。
生成过程：检索到的相关信息随后被输入到一个生成模型中，该模型利用这些信息来生成最终的、更加精准和上下文相关的回复。这样，生成的文本不仅语法流畅，还富含检索到的具体内容。

RAG的优势在于它能够即时从外部数据源获取信息，从而克服了大型语言模型依赖于固定训练数据集的局限性，使得模型能够提供最新、准确的内容。这种方法特别适合于问答系统、文本摘要、对话系统等应用场景，其中需要模型具备引用外部信息或特定领域知识的能力。

综上所述，RAG是一种创新策略，通过融合检索与生成技术，增强了LLM处理任务的能力，提高了生成内容的相关性和准确性，同时保持了生成模型的灵活性和创造性。

bigshark_software

关注

13
点赞
踩
18

收藏

觉得还不错? 一键收藏
打赏
0
评论
2024-06-19 问AI: 在LLM中，RAG是什么？

例如，在处理一个需要根据已知事实推导新结论的问题时，RAG 可以帮助模型识别和利用相关的事实和关系，从而提高推理的准确性。简而言之，RAG 是搜索+LLM 提示的结合，即在有搜索算法找到的信息作为上下文的情况下，让模型回答提出的查询。综上所述，RAG是一种创新策略，通过融合检索与生成技术，增强了LLM处理任务的能力，提高了生成内容的相关性和准确性，同时保持了生成模型的灵活性和创造性。总之，RAG是一种重要的技术，通过检索增强生成的方式，显著提升了LLMs在实际应用中的性能和准确性。
复制链接

扫一扫