为本地大模型增加知识库（本地RAG）

最新推荐文章于 2025-04-05 00:57:23 发布

小马不会过河

最新推荐文章于 2025-04-05 00:57:23 发布

阅读量3.2k

点赞数 30

文章标签： vscode ide 编辑器人工智能开源

本文链接：https://blog.csdn.net/m0_59163425/article/details/145688387

版权

我发现 DeepSeek R1 的 14B 模型在文字处理方面已经能够提供很好的体验，对系统资源占用也较小，是一个不错的平衡选择。

但有时，我希望能够指定一些特定信息，辅助模型进行更精准的回答，也希望模型能够对特定文档进行分析和整理，这时我们就需要一个知识库系统来提供支持。

Open WebUI 自带 RAG 能力，但其默认的sentence-transformers/all-MiniLM-L6-v2嵌入模型在文本处理上（特别是中文）使用体验不太好。导致 R1 模型不论是 14B 还是 32B，其处理结果总是不太令人满意。

现在主流的 AI 网站都支持知识库能力，但如果你对数据隐私比较敏感，不愿意将数据上传至第三方网站进行分析，同时又有知识库的使用需求，那么可以考虑这个替代方案：Ollama + DeepSeek R1 + Open WebUI + bge-m3。

1. 下载bge-m3

我们只需用 bge-m3 替换掉sentence-transformers/all-MiniLM-L6-v2即可。命令如下：

ollama pull bge-m3

bge-m3 下载成功后，可使用下述命令查看信息。该嵌入模型不用手动启动，在 WebUI 上完成配置后即可自动调用。

ollama list

2. 在Open WebUI中进行配置

在管理员面板 - 设置 - 文档中，将“语义向量模型引擎”由默认的“sentence-transformers”改为“ollama”，“语义向量模型”一栏填入“bge-m3:latest”。

在 WebUI 中进入管理员面板 - 设置 - 模型，即可看到该嵌入模型。

3. 在工作空间-知识库中上传知识库文档。

4. 在大模型对话框中输入“#”，即可引用本地知识库。

5. 示例：对指定 Excel 文件进行分析（数据仅做参考）

完成以上步骤后，本地知识库就搭建完成了。

另外请注意，Open WebUI 默认使用的向量数据库是 sqlite，对于大数据量的支持比较有限，可以考虑用 Chroma 进行替代。

总结：

通过本文的介绍，我们为本地大模型 DeepSeek R1 搭建了一个基于 bge-m3 嵌入模型的知识库系统。这个方案不仅解决了 Open WebUI 默认嵌入模型对中文处理不佳的问题，还保护了用户的数据隐私，避免将敏感数据上传到第三方平台。

本地知识库的搭建，为我们更有效地利用大模型提供了强大的支持。无论是精准问答、文档分析还是信息整理，本地知识库都能发挥重要作用。

此外，我们还提到了使用 Chroma 向量数据库替代 sqlite 的方法，以应对大数据量的场景。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述