【AI 大模型】RAG 检索增强生成 ① ( 大模型的相关问题描述 - 幻觉、时效性、数据安全 | RAG 检索增强生成 | RAG 关键组件 | LLM + RAG 的运行流程 )

最新推荐文章于 2024-09-11 14:42:31 发布

韩曙亮

最新推荐文章于 2024-09-11 14:42:31 发布

阅读量3.3k

点赞数 52

分类专栏：人工智能文章标签：人工智能 chatgpt RAG AI 大模型 LLM 大语言模型检索增强生成

本文链接：https://blog.csdn.net/shulianghan/article/details/140922035

版权

人工智能专栏收录该内容

20 篇文章 8 订阅

订阅专栏

在这里插入图片描述

一、大模型的相关问题描述

1、大模型 " 幻觉 " 问题描述

AI 大模型不知道 ① 实时性的信息或 ② 特定领域的私有信息 , 如果在私有场景中向大模型提问相关问题 , 大模型训练时没有接触过这些知识 , 就会随机生成错误输出 ;

ChatGPT 产生 " 幻觉 " 的案例 ,

目前 ChatGPT 免费版本使用的是 ChatGPT 4o mini 模型 , 其训练数据时 2022 年初收集的 , 之后的实时信息是没有的 , 向 ChatGPT 大模型提问 " Meta 发布的 Llama3 怎么样 " , 大模型时回答不上来的 , 因为 Llama3 是最近刚发布的 ;

在这里插入图片描述

再问 ChatGPT 一次 , 第二次在 ChatGPT 输入框中输入 " Meta 发布的 Llama3 怎么样 " , 结果得到了新的答案 ;

在这里插入图片描述

ChatGPT 你是知道还是不知道 , 出现了幻觉 , 这就是 LLM 随机生成文本造成的 " 幻觉 " 问题 , 对于不知道的知识 , 无法生成准确的答案 , 基本都是胡说八道 ;

为了解决上述问题 , 通过检索的手段将大模型不知道的知识或信息 , 动态的补充到大模型中 , 具体操作就是将这些知识或信息存放到向量数据库 ( 知识库 ) 中 ;

大模型如果遇到不知道的知识 , 就回到知识库中去查询 , 然后再生成输出文本 ;

这套机制就是 RAG , 事实上 GPT 大模型内置了 RAG 功能 ;

2、大模型 " 时效性 " 问题描述

大语言模型的数据更新经常是滞后的 , LLM 的训练数据通常是基于过去的信息 ,

如 : GPT3.5 的数据截止到 2022 年 1 月 , 收集数据完成后 , 训练半年 , 在 2022 年 7 月推出该模型 ,

这导致 LLM 大语言模型总是无法实时地反映当前的事件和信息 ;

哪怕是 OpenAI 最新的 GPT 大模型 GPT-4o , 这是 OpenAI 在2024 年发布的旗舰模型 , 其训练数据截止时间是 2023 年 10 月 , 到现在 2024 年 8 月 , 将近 10 个月的最新信息 , GPT-4o 模型是不知道的 ;

大语言模型的实时需求难以满足 , 对于需要及时更新的任务 , 如 : 最新的新闻、市场变化或实时事件的分析 , 大型模型可能无法提供即时和精确的答案 , 因为它们的训练数据不包含最新的信息 ;

3、大模型 " 数据安全 " 问题描述

大语言需要大量的训练数据 , 这些数据可能包含个人身份信息、商业敏感数据等 ;

如果这些隐私数据未经适当保护地上传到云端或公共服务器 , 存在泄露和滥用的风险 ;

在一些国家和行业中 , 将敏感数据上传到外部的云端服务可能违反法律或行业规定 , 特别是涉及医疗健康、金融或个人隐私的数据 ;

大语言模型训练时 , 不能使用个人隐私数据、商业敏感信息、保密信息等数据 , 因此在进行提问时 , 大模型可能无法回答出上述问题 ;

通过本地部署的 RAG , 可以解决上述问题 , 将个人隐私数据、商业敏感信息、保密信息等数据保存在本地 , 然后将本地检索出的数据 + 用户问题组合成提示词 , 传递给在本地部署的大模型 , 就可以解决大模型的数据安全问题 ;

二、RAG 检索增强生成

1、RAG 引入

RAG 的英文全称 " Retrieval Augmented Generation " , 检索增强生成 ;

RAG 通过检索模型从外部数据源中检索相关信息 , 同时将这些信息作为上下文提供给生成模型 , 以生成更加准确的回答 ;

RAG 模型能够有效缓解 LLM ( Large Language Models , 大预言模型 ) 在处理知识密集型任务时可能出现的 " 幻觉 " 问题 ,

" 幻觉 " 指的是生成的文本看似合理 , 但实际上错误百出 , 这是基于概率生成的文本 , 同时提高生成内容的透明度和可靠性

RAG 是一种结合了检索和生成的人工智能模型架构 , 其解决生成模型在生成文本任务中可能遇到的信息获取和内容准确性的问题 ;

2、RAG 关键组件

RAG 模型有两个关键组件 :

检索器 Retriever : 这是专门用于从大型知识库中检索相关信息的组件 , 检索器可以使用各种技术来快速地找到与当前生成任务相关的文本片段或文档 ;
- 倒排索引 : 是一种数据结构 , 用于存储在文本数据中词项与其出现位置之间的映射关系 , 是现代搜索引擎中最基础、最核心的技术之一 ;
- BM25 ( Best Matching 25 ) : 是一种评分函数 , 用于衡量查询与文档之间匹配程度的算法 , 也是信息检索领域中常用的一种评分模型 ;
生成器 Generator : 就是 GPT 大模型 ; 生成器的作用是根据检索器提供的信息 + 原来的提问组合成新的提示词 , 输入到大模型中来生成最终的文本输出 ;

RAG 模型在工作时 , 先试用检索器进行检索 , 然后试用生成器生成文本 ;

检索阶段 : 检索器根据当前任务和上下文 , 从知识库中找到最相关的几篇文章或文本段落 ;
生成阶段 : 生成器使用检索器提供的信息 , 结合上下文和任务要求 , 生成最终的文本输出 ;

3、LLM + RAG 的运行流程

LLM + RAG 的运行流程 :

预处理阶段 : 用户向 LLM 大语言模型问出了一个问题 ;
- 如果 LLM 直到答案 , 直接输出 ;
- 知识库检索 : 如果 LLM 不知道答案 , 那么就去查询 RAG 知识库 , 从知识库中检索相关的知识 ;
生成 Prompt 提示词 : 将用户的初始问题和知识库检索出来的信息 , 拼接成一个 Prompt 提示词 , 然后再提交给 LLM 大预言模型 ;
生成文本 : LLM 接收提示词 , 输出正确的文本 ;

在这里插入图片描述

LLM 大语言模型不知道用户提出的问题答案 , 从本地知识库中找到了相关的知识信息 , 可以在一定程度上抑制 LLM 的 " 幻觉 " , 不会随机生成错误文本 ;

参考资料 :

韩曙亮

关注

52
点赞
踩
46

收藏

觉得还不错? 一键收藏
25
评论
【AI 大模型】RAG 检索增强生成 ① ( 大模型的相关问题描述 - 幻觉、时效性、数据安全 | RAG 检索增强生成 | RAG 关键组件 | LLM + RAG 的运行流程 )

一、大模型的相关问题描述1、大模型 " 幻觉 " 问题描述2、大模型 " 时效性 " 问题描述3、大模型 " 数据安全 " 问题描述二、RAG 检索增强生成1、RAG 引入2、RAG 关键组件3、LLM + RAG 的运行流程
复制链接

扫一扫

专栏目录