书生浦语第三课

  1. RAG应用场景:在大模型创建后发生了一些新闻,如果不进行RAG优化,那么大模型很可能会对这些数据库中没有的问题产生幻觉(胡说八道)。
  2. RAG工作原理:(1) 索引:将知识源数据库中的信息转化为向量。(2) 检索:把用户输入的问题转化为向量并从库中寻找与该向量相关的向量。(3) 生成:生成最终回答
  3. 向量数据库:向量数据库是RAG的关键部分之一,将信息转化为固定长度的向量。而进行检索匹配的时候通常会使用余弦相似度比较的方法来找出相关向量。
  4. RAG优化方法:(1) 嵌入优化和索引优化:就是通过提高向量数据库的质量进行RAG优化。(2) 查询优化:使用户问题更加清晰,更适合检索。(3) 上下文管理:删去问题中的冗余信息以提高效率。(4) 迭代检索、递归检索和自适应检索:分别进行重复搜索,链式检索和主动检索。(5) LLM微调。
  5. RAG与微调的区别:(1) RAG通常适用于与时效性有关的任务,比较依赖外部数据库和大模型基础。(2) 微调通常适用于专业化任务,可以针对专业化任务进行特殊优化,但是对新任务的适应能力差。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值