书生浦语大模型-第三课笔记

搭建你的 RAG 智能助理

RAG

RAG: 检索增强生成, 通俗理解为检索引擎,从知识库中所有相关内容,结合大语言模型生成回答。

RAG的工作原理

第一步: 生成索引, 将知识源文件,网页等分割成chunk,编码成向量存储到向量数据库中。

第二步: 将用户的问题编码成向量在向量数据库中检索

第三步: 将检索到的片段与远程问题一起作为提示给大模型生成最终回答的问题,返还给用户

向量数据库

RAG发展进程

三种RAG的范式:

  1. Naive RAG: 即索引,检索,生成三部分构成的最基本的泛式, 这种范式经常用于简答的问答系统和信息检索场景中

  2. Advanced RAG: 在三个基础部分之外对检索前后都进行了增强,在检索之前对用户的问题进行路由,扩展,重写等处理, 在检索到的内容进行重排序,总结。融合等处理,是信息收集和处理效率更高。常用于摘要生成,内容推荐场景

  3. Modular RAG: 将RAG的基础部分和后续的各种优化技术和功能模块化,可以根据实际需求定制,可以完成多模态任务和对话系统

RAG优化方法

  1. 嵌入式优化和索引优化: 提高向量数据库的质量来提高RAG性能

  2. 查询过程优化和上下文管理: 这两种方法就是Advance RAG泛式中的前检索和后检索部分

  3. 检索是RAG优化的重中之重常见的三种检索优化方式为: 迭代检索,递归检索,自适应检索。

  4. 微调也是RAG优化中常见的思路

RAG和微调区别

大模型常用优化方法比较

从两个方面进行比较:

  1. 任务对外部知识的需求:

  2. 任务对模型适配需求:

    提示工程: 在以上两个方面的表现都是比较差的,同时对特定任务难于有很专业表现

    微调:适配于对外部知识要求不高同时对模型适配要求很高的优化手段

    RAG: 则与微调正好相反

RAG评价

通常将RAG的检索阶段和生成阶段进行单独评价。

茴香豆介绍

特性:

茴香豆工作流:

线上茴香豆使用

线上茴香豆地址: OpenXLab浦源 - 应用中心

  1. 创建知识库和密码

  2. 上传word文档

聊天测试

  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值