【百问大模型02】一文讲透RAG实战全解析

1.实时性无法更新,知识容易自相矛盾

2.大模型的缺点有哪些?

3.一个人的能力可以分为两种:

1)大模型:推理能力,聪明,知识;很聪明但是缺少知识

2)知识库:辅助记忆,人类历史积累下来的东西,论知识,可能牛顿都不如你;

推理能力+记忆力=人工智能

4、最常见的embedding模型,bert;向量的相似度代替文本的相似度;

5、检索技术+提示词工程+大模型,RAG的方法论

6、对象数据库怎么设计和实现

7、技术实现细节

文档种类多:doc,ppt,excel,pdf
切分方式:段落、句子、token、知识点;切分原因:大模型输入长度有限制;理想的切分方式,按照知识点来切分,但是不容易操作;按段落分,容易出现一个知识点横跨多段的时候,容易分割成2段或者多段,使用交叉重叠来减缓这个问题,但是不能解决;

8、内部知识的特殊性,这个是比较麻烦的事情,专业术语不容易理解,需要辅助一些外部资料解决;

9、如果大量数来自网络,大部分工作是花在数据清洗上面;

10、检索:用户的问题,找到对应的知识,就是检索的作用;常见的检索技术,会经常被用到,搜、广、推;

相似度检索:欧氏距离、曼哈顿距离、余弦相似度

关键词检索:ti-idf

SQL检索:传统的检索算法

11、向量检索:query和知识可以通过相似度向量比较检索,搜索一些top的结果,可以加一下文本规则的限制,提升精准度,得到召回来的知识;对找回来的知识进行排序,把用户的问题,召回来的知识,给他下个模型,输出0和1,0表示不相关,1表示相关强烈,然后对输出的结果进行排序,输出检索的结果;

13、树检索,把知识整理成树的结构;知识图谱,召回一个知识,也把另外一个知识给召回,知识构建、维护成本很高,好用但是慎用;

14、对用户的问题,进行优化,比如用大模型来扩展问题HyDE,利用大模型来做假答案,取向量平均值;

15、RAG Fusion:主要是在检索的环节做了拓展;用大模型生成类似的话术问题;防止用户的输入过于口语化,导致找回不了;每个quey和原生query,一起召回,排序,rerank,得到最终的结果;

16.问题-知识对,放到向量库->创建索引

17.用户输入问题后,对问题进行一次拓展,使用大模型来拓展,得到3个相似的问题;问了描述的更好,还可以加一下用户的一些特征信息,例如性别等等,辅助检索;

18.召回5个(bert1模型:召回模型的bert),精排3个(排序模型的bert,分类,运算量更大)

下载别人开源的bert,不太适合直接用,因为场景太垂直了,开源的未必匹配的会那么好

19.召回的知识,然后给出问题,告诉大模型,根据上述的治疗方案,给出下面病情的治疗方案;

20.RAG的核心就是相似度计算,相似度计算有很多种方法;

21.SFT和微调并不矛盾,可以融合、组合起来使用;

22.不要以完美主义要求大模型,要不然什么都做不了;

------------------ppt---------------------








 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值