【书生·浦语大模型实战营第二期】“茴香豆“:搭建你的 RAG 智能助理——学习笔记3

基础知识

RAG

image.png

通俗易懂的理解:将rag技术作为搜索引擎,用户的问题作为索引,在外部向量知识库中搜索相关的内容,再结合大语言模型的能力生成回答。助力LLM处理知识密集型任务。

image.png

向量数据库
需要完成数据存储、相似度检索以及面对大规模数据集时的向量表示优化
具体而言,
数据存储是通过预训练模型将待存储数据转换为固定长度的向量表示;
相似度检索是利用用户的查询向量在数据库中找到最相关的向量,通常使用点积相似度或余弦相似度
优化向量表示考虑:更换向量化过程使用的预训练模型、使用更高级的文本编码技术、更改嵌入方式如句子嵌入或段落嵌入、优化数据库

RAG发展历程

三个RAG范式
Naive RAG ->
Naive RAG
只有索引、检索、生成三个部分构成的最基本的范式,可用于问答系统、信息检索等任务中
Advanced RAG
基本部分之外,在检索前后都进行了增强,在检索之前对用户的问题进行了路由、扩展、重写等处理;对检索到的信息重排序、总结融合等处理。用于摘要生成、内容推荐等任务
Modular RAG
模块化各种优化技术,根据业务需求定制,用于多模态任务对话系统等更高级的应用

2024 RAG-survey的配图

RAG常见优化方法

通过对RAG各个模块进行分析得到以下优化方法:
针对向量数据库
Embedding嵌入优化、Indexing索引优化
在检索前后进行的优化
Query查询优化、Context上下文管理
针对检索的优化
Iterative迭代检索、Recursive递归检索、Adaptive自适应检索
针对RAG中的LLM进行优化
主要形式为微调,可以是对场景数据的定向微调,也可以是针对检索/生成的指定模块微调

对比RAG和finetuning

image.png

对比各种LLM优化方法:prompt工程、RAG技术、fine-tuning技术解决的问题,从两个方面来考虑,一个是外部知识需求程度,一个是模型适配度要求程度
image.png

RAG技术的评价

学术相关
评价目标:检索器和生成器的质量
image.png

HuiXiangDou

基于LLM的领域知识助手
应用场景
image.png
豆哥的优势
本地部署,保护数据和用户隐私
支持远端LLM,提供混合LLM
支持多种即时通讯软件
拒答工作流的构建使得豆哥更加适合群聊场景
构建流程
image.png

豆哥的工作流
image.png
拒答工作流
通过设定茴香豆的回答分数范围,将某些不重要的信息排除在外
image.png
回答工作流
综合多来源检索的结果,利用混合大模型生成回答
image.png

实践操作

在茴香豆Web版中创建自己领域的知识问答助手

茴香豆 Web 版中创建自己领域的知识问答助手:
上传文件为软件测试与质量保证课程的6章ppt,问题为该课程的课后习题
3dd1b5285682a0dabb055db0f859e55.png

InternLM Studio 上部署茴香豆技术助手

配置文件修改:
image.png

向量知识库创建:
image.png

运行茴香豆知识助手:
image.png
image.png

使用kimi_chat的api key调用
image.png

参考资料

  1. 学习文档
  • 9
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值