知识库
RAG(检索增加生成)
wxl781227
生命如昙花一现,愿每一段行程象如歌的行板,灿烂而又真实!
展开
-
使用langchain及openai创建本地知识库
3. 将知识文件放在kb目录下,以.txt或.doc或.pdf文件的形式存在。5.登录app界面 localhost:8500开始提问吧。2.设置openai api key。原创 2023-05-11 10:58:37 · 2656 阅读 · 3 评论 -
如何提升RAG检索的准确率及答案的完整性?
为了照顾短答案,使用分片长度为100,重叠50,来提升检索提问上下文定位的准确率,并提升分片的完整度(不能完全保证)。至于重排模型,可用可不用,个人认为作用不大,使用重排模型的主要目的是因为检索不准确,检索准确了,重排的意义就不大,检索不准确的主要原因是以考虑到检索的速度,降低了一定的准确度,但当分片设置的比较小时,检索的准确率就提升上来了。大家有没有发现开源RAG的默认分片长度为250, 重叠为50,但是存在检索准确率不高(找不到答案或找到的上下文无法回答该问题)和答案不完整(答案有缺失)的问题。原创 2024-09-15 11:39:55 · 263 阅读 · 0 评论