【百问大模型02】一文讲透RAG实战全解析

1.实时性无法更新,知识容易自相矛盾

2.大模型的缺点有哪些?

3.一个人的能力可以分为两种:

1)大模型:推理能力,聪明,知识;很聪明但是缺少知识

2)知识库:辅助记忆,人类历史积累下来的东西,论知识,可能牛顿都不如你;

推理能力+记忆力=人工智能

4、最常见的embedding模型,bert;向量的相似度代替文本的相似度;

5、检索技术+提示词工程+大模型,RAG的方法论

6、对象数据库怎么设计和实现

7、技术实现细节

文档种类多:doc,ppt,excel,pdf
切分方式:段落、句子、token、知识点;切分原因:大模型输入长度有限制;理想的切分方式,按照知识点来切分,但是不容易操作;按段落分,容易出现一个知识点横跨多段的时候,容易分割成2段或者多段,使用交叉重叠来减缓这个问题,但是不能解决;

8、内部知识的特殊性,这个是比较麻烦的事情,专业术语不容易理解,需要辅助一些外部资料解决;

9、如果大量数来自网络,大部分工作是花在数据清洗上

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值