Datawhale AI 夏令营 Task03学习笔记

学习笔记:检索增强生成 (RAG) 方法概述

1. 引言

在实际业务场景中,通用的大模型可能无法满足特定需求,主要由于以下原因:

  • 知识局限性:大模型只能基于训练数据生成回答,而这些数据大多来自公开资源,无法包含实时性或非公开的信息。
  • 数据安全性:企业数据需要安全保护,纳入训练集可能导致数据泄露风险。
  • 大模型幻觉:由于大模型基于概率统计进行生成,有时可能输出错误信息,尤其在模型知识薄弱的领域。

为解决上述问题,研究人员提出了检索增强生成(RAG)的方法。RAG通过引入外部知识,提升大模型的准确性,减少模型幻觉的出现,成为了主流的应用方案之一。

2. RAG 基本步骤

RAG通常包括以下三个基本步骤:

  1. 索引:将文档库分割成较短的文本块(Chunks),并构建向量索引。
  2. 检索:计算问题与文本块的相似度,检索出相关内容。
  3. 生成:将检索到的内容作为背景信息,生成回答。
3. RAG 完整链路

线上接收用户查询后,RAG先进行检索,将相关内容与查询一并输入大模型,生成答案。为了支持检索,需要提前进行离线计算在线计算

3.1 离线计算
  • 文档处理:解析并切割文档,将其转化为较短的文本块,并进行清洗和去重。
  • 向量化:将文本块转化为向量,并存储到数据库中。此过程通常离线完成,以处理大量数据。
3.2 在线计算
  • 检索:用户查询通过向量模型计算相似度,从数据库中检索最相近的内容块。
  • 召回:从数据库快速获取相关内容块,减少计算复杂度。
  • 重排:通过重排模型提升检索效果,使得最相似的结果排名更靠前。
4. 开源 RAG 框架

目前有多个开源 RAG 框架,如 TinyRAG、LlamaIndex、LangChain 等,它们各具特色,推动了 RAG 技术的发展。

5. 总结

通过 RAG 技术,利用外部知识增强大模型的能力,有效解决了知识局限性和数据安全性问题,并减少了模型幻觉的出现。理解和掌握 RAG 的核心步骤,可以帮助我们更好地构建智能对话系统。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值