【百问大模型02】一文讲透RAG实战全解析

sjh752422969

已于 2024-06-24 07:35:18 修改

阅读量388

点赞数 3

文章标签：人工智能

于 2024-06-23 23:55:41 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sjh752422969/article/details/139908560

版权

1.实时性无法更新，知识容易自相矛盾

2.大模型的缺点有哪些？

3.一个人的能力可以分为两种：

1）大模型：推理能力，聪明，知识；很聪明但是缺少知识

2）知识库：辅助记忆，人类历史积累下来的东西，论知识，可能牛顿都不如你；

推理能力+记忆力=人工智能

4、最常见的embedding模型，bert；向量的相似度代替文本的相似度；

5、检索技术+提示词工程+大模型，RAG的方法论

6、对象数据库怎么设计和实现

7、技术实现细节

文档种类多：doc，ppt，excel，pdf
切分方式：段落、句子、token、知识点；切分原因：大模型输入长度有限制；理想的切分方式，按照知识点来切分，但是不容易操作；按段落分，容易出现一个知识点横跨多段的时候，容易分割成2段或者多段，使用交叉重叠来减缓这个问题，但是不能解决；

8、内部知识的特殊性，这个是比较麻烦的事情，专业术语不容易理解，需要辅助一些外部资料解决；

9、如果大量数来自网络，大部分工作是花在数据清洗上面；

10、检索：用户的问题，找到对应的知识，就是检索的作用；常见的检索技术，会经常被用到，搜、广、推；

相似度检索:欧氏距离、曼哈顿距离、余弦相似度

关键词检索：ti-idf

SQL检索：传统的检索算法

11、向量检索：query和知识可以通过相似度向量比较检索，搜索一些top的结果，可以加一下文本规则的限制，提升精准度，得到召回来的知识；对找回来的知识进行排序，把用户的问题，召回来的知识，给他下个模型，输出0和1，0表示不相关，1表示相关强烈，然后对输出的结果进行排序，输出检索的结果；

13、树检索，把知识整理成树的结构；知识图谱，召回一个知识，也把另外一个知识给召回，知识构建、维护成本很高，好用但是慎用；

14、对用户的问题，进行优化，比如用大模型来扩展问题HyDE，利用大模型来做假答案，取向量平均值；

15、RAG Fusion：主要是在检索的环节做了拓展；用大模型生成类似的话术问题；防止用户的输入过于口语化，导致找回不了；每个quey和原生query，一起召回，排序，rerank，得到最终的结果；

16.问题-知识对，放到向量库->创建索引

17.用户输入问题后，对问题进行一次拓展，使用大模型来拓展，得到3个相似的问题；问了描述的更好，还可以加一下用户的一些特征信息，例如性别等等，辅助检索；

18.召回5个（bert1模型：召回模型的bert），精排3个（排序模型的bert，分类，运算量更大）

下载别人开源的bert，不太适合直接用，因为场景太垂直了，开源的未必匹配的会那么好

19.召回的知识，然后给出问题，告诉大模型，根据上述的治疗方案，给出下面病情的治疗方案；

20.RAG的核心就是相似度计算，相似度计算有很多种方法；

21.SFT和微调并不矛盾，可以融合、组合起来使用；

22.不要以完美主义要求大模型，要不然什么都做不了；

------------------ppt---------------------

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。