1.实时性无法更新,知识容易自相矛盾
2.大模型的缺点有哪些?
3.一个人的能力可以分为两种:
1)大模型:推理能力,聪明,知识;很聪明但是缺少知识
2)知识库:辅助记忆,人类历史积累下来的东西,论知识,可能牛顿都不如你;
推理能力+记忆力=人工智能
4、最常见的embedding模型,bert;向量的相似度代替文本的相似度;
5、检索技术+提示词工程+大模型,RAG的方法论
6、对象数据库怎么设计和实现
7、技术实现细节
文档种类多:doc,ppt,excel,pdf
切分方式:段落、句子、token、知识点;切分原因:大模型输入长度有限制;理想的切分方式,按照知识点来切分,但是不容易操作;按段落分,容易出现一个知识点横跨多段的时候,容易分割成2段或者多段,使用交叉重叠来减缓这个问题,但是不能解决;
8、内部知识的特殊性,这个是比较麻烦的事情,专业术语不容易理解,需要辅助一些外部资料解决;
9、如果大量数来自网络,大部分工作是花在数据清洗上

最低0.47元/天 解锁文章

592

被折叠的 条评论
为什么被折叠?



