Datawhale AI 夏令营：大模型应用开发--Task03笔记

最新推荐文章于 2024-08-18 16:04:24 发布

kichi123

最新推荐文章于 2024-08-18 16:04:24 发布

阅读量723

点赞数 6

文章标签：笔记 ai 语言模型 prompt

本文链接：https://blog.csdn.net/m0_73164476/article/details/141287515

版权

#task03链接Datawhale

一、什么是RAG

RAG（检索增强生成，Retrieval Augmented Generation）是一种结合了外部知识检索与生成模型的技术，用以解决大模型在实际应用中可能存在的几个问题：

知识局限性：基础大模型的知识主要来源于训练数据，对于实时性或非公开的知识，大模型可能无法掌握。RAG通过检索外部知识库，使模型能够获取和利用最新或专有的知识。
数据安全性：为了保护企业的数据安全，不必将敏感数据纳入模型训练集，而是通过RAG在生成过程中动态检索和引用外部数据，避免了数据泄露的风险。
大模型幻觉：由于大模型是基于概率生成的，有时会出现“胡说八道”的情况。通过RAG方法，生成模型能够参考外部知识，从而减少这种幻觉的发生，生成更准确和可靠的答案。

RAG的方法主要包括三个步骤：检索外部知识、结合上下文生成答案，以及输出增强后的生成结果。这使得大模型在复杂场景中能够更好地应对挑战。

二、完整的RAG链路

RAG（Retrieval-Augmented Generation）系统的两个主要步骤：离线计算和在线计算。：

离线计算：

在线计算：

目前，开源社区中已经涌现出了众多RAG框架，例如：

四、RAG案例实战

PAI实例创建创建流程与速通手册一致~

通过环境准备与模型下载，本次我们选用基于BERT架构的向量模型 bge-small-zh-v1.5，它是一个4层的BERT模型，最大输入长度512，输出的向量维度也为512。（模型在魔搭平台的地址为 AI-ModelScope/bge-small-zh-v1.5。）

向量模型下载~

# 向量模型下载
from modelscope import snapshot_download
model_dir = snapshot_download("AI-ModelScope/bge-small-zh-v1.5", cache_dir='.')

下载完成后~

关注