RAG整体过程
RAG 概念最近比较火,RAG,Retrieval-Augmented Generation,检索增强生成。结合检索技术+大模型生成技术提供整体大模型生成的效果。同时 RAG 解决了大模型幻觉,知识更新不及时等等问题。
RAG 整体效果
RAG 的效果,其实是和文档处理,embedding,召回,以及最后的大模型效果都关联,可以简单用下面一个公式来表示:
两家典型厂商背景
腾讯 VectorDB
基于 faiss 扩展而来
2023 年 8 月上线
2023 年 10 月份对外公测(单节点,EIP)
2024 年 3 月 20 日开始计费
2024 年 4 月10 日开始商用
国内云厂商第一个发向量数据库
腾讯云团队和内部团队合作共建(内部团队叫 Andon)
向量数据库包含向量数据库+AI 套件,两者 API 单独,AI 套件导入的数据不支持修改
Azure AI Search
以前叫 “AI 认知搜索”
2023 年 6 月向量检索公测
2023 年 11 月向量搜索正式发布
2024 年 2 月,向量的维度上限现在从
2048
增加到3072
每个阶段的关键点
先来看看 RAG 每个阶段的一些关键点和优化经验。
步骤 | 关键点 |
数据提取 |
|
数据分块(Chunking) |
|
embedding |
|
query 预处理 | 完整的 RAG 检索流程,在几个环节都有提升空间
|
检索召回 | |
rerank | |
prompt |
|
腾讯 VectorDB 主要优化点
腾讯向量数据库做了一些优化,看看其中的关键点
步骤 | 腾讯 VectorDB |
数据提取 | 没有明显的优化 |
数据分块(Chunking) | 对下面四种文档做了优化:
主要优化是:
|
embedding | 支持以下开源 embedding 模型
还提供垂类embedding 模型微调,提升效果 |
query 预处理 | query 预处理几个提升
|
检索召回 |
|
rerank |
|
prompt |
|
API&SDK |
|
Azure AI Search 主要优化点
Azure AI Search 能力很全,一起看看 AI Search 的关键能力。
步骤 | Azure AI Search |
数据提取 |
|
| |
数据分块(Chunking) | 无特殊优化 |
embedding |
|
query预处理 | 无特殊优化 |
检索召回 |
|
rerank |
|
prompt | 无特殊优化 |
知识存储 |
|
缓存扩充 | 增量扩充(预览)是指可在技能集执行期间重复使用的缓存扩充。 缓存在包括 OCR 和图像分析的技能组(处理成本很高)中尤其有用。 |