搭建你的 RAG 智能助理
RAG
RAG: 检索增强生成, 通俗理解为检索引擎,从知识库中所有相关内容,结合大语言模型生成回答。
RAG的工作原理
第一步: 生成索引, 将知识源文件,网页等分割成chunk,编码成向量存储到向量数据库中。
第二步: 将用户的问题编码成向量在向量数据库中检索
第三步: 将检索到的片段与远程问题一起作为提示给大模型生成最终回答的问题,返还给用户
向量数据库
RAG发展进程
三种RAG的范式:
-
Naive RAG: 即索引,检索,生成三部分构成的最基本的泛式, 这种范式经常用于简答的问答系统和信息检索场景中
-
Advanced RAG: 在三个基础部分之外对检索前后都进行了增强,在检索之前对用户的问题进行路由,扩展,重写等处理, 在检索到的内容进行重排序,总结。融合等处理,是信息收集和处理效率更高。常用于摘要生成,内容推荐场景
-
Modular RAG: 将RAG的基础部分和后续的各种优化技术和功能模块化,可以根据实际需求定制,可以完成多模态任务和对话系统
RAG优化方法
-
嵌入式优化和索引优化: 提高向量数据库的质量来提高RAG性能
-
查询过程优化和上下文管理: 这两种方法就是Advance RAG泛式中的前检索和后检索部分
-
检索是RAG优化的重中之重常见的三种检索优化方式为: 迭代检索,递归检索,自适应检索。
-
微调也是RAG优化中常见的思路
RAG和微调区别
大模型常用优化方法比较
从两个方面进行比较:
-
任务对外部知识的需求:
-
任务对模型适配需求:
提示工程: 在以上两个方面的表现都是比较差的,同时对特定任务难于有很专业表现
微调:适配于对外部知识要求不高同时对模型适配要求很高的优化手段
RAG: 则与微调正好相反
RAG评价
通常将RAG的检索阶段和生成阶段进行单独评价。
茴香豆介绍
特性:
茴香豆工作流:
线上茴香豆使用
线上茴香豆地址: OpenXLab浦源 - 应用中心
-
创建知识库和密码
-
上传word文档
聊天测试