本地知识库搭建指南：DeepSeek-R1与RAG技术的完美结合

AGI大模型资料分享员

于 2025-05-19 13:42:11 发布

阅读量815

点赞数 21

文章标签：人工智能自然语言处理搜索引擎语言模型开源大模型 deepseek

本文链接：https://blog.csdn.net/m0_48891301/article/details/148060322

版权

一、RAG：检索增强生成技术解析

（一）RAG是什么

检索增强生成（Retrieval-Augmented Generation，RAG）是一种创新的文本生成技术。它能够从私有或专有数据源中提取信息，为文本生成提供有力补充。这种技术就像是给大型语言模型（LLMs）配备了一副“望远镜”，使其能够看到更广阔的知识世界。

（二）RAG为何而生

虽然大型语言模型（LLMs）功能强大，但它们也面临一些挑战。例如，有时会产生不准确的信息，就像在黑暗中摸索时不小心走错了方向；知识更新速度跟不上时代步伐，就像一本过时的百科全书；推理过程不够透明，让人难以理解其决策依据。为了克服这些挑战，RAG技术应运而生，它就像是为LLMs注入了一股“强心剂”。

RAG通过结合外部数据库的知识，让信息生成变得更加准确和可靠。它适用于各种需要丰富知识的任务，比如撰写学术论文、提供专业咨询等。RAG还能让模型持续更新知识，整合特定领域的信息，实现LLMs内在知识与外部动态数据库的完美协同融合。

（三）RAG的核心技术

检索、生成和增强是RAG框架中的三大核心组件，它们相互协作，共同推动整个框架高效运转，实现高效、准确、多样化的信息生成和处理。

检索（Retrieval）：这是RAG的“眼睛”，负责从知识库中快速准确地找到与输入查询相关的信息。它可以通过关键词、向量或深度学习等方法，像在浩瀚的知识海洋中精准定位宝藏一样，提高检索效率。
生成（Generation）：这是RAG的“大脑”，根据检索到的信息和用户输入生成符合期望的输出。它采用模板、序列到序列模型或大型语言模型等技术，并进行后处理和微调，就像一位经验丰富的作家，精心雕琢文字，以提高生成质量。
增强（Augmentation）：这是RAG的“美容师”，在生成前后对信息进行额外处理或补充。通过知识增强、多样性增强和后处理增强等手段，它能让输出的信息更加完美，提高输出的质量和多样性。

二、Ollama + RAGFlow：本地知识库搭建实战

（一）Ollama本地化部署DeepSeek-R1

Ollama是一款开源的本地化大模型部署工具，它就像是一个贴心的“管家”，让用户能够轻松安装、配置和运行各种开源大模型（DeepSeek-R1）。

下载并安装Ollama

访问Ollama的官方，根据你的电脑系统（macOS、Linux、Windows）选择对应的版本下载。双击安装程序并按照提示完成安装。安装完成后，如果在顶部菜单栏中看到Ollama的图标，那就恭喜你，Ollama已经成功运行了。

准备DeepSeek-R1模型

在Ollama的官网中，找到并点击“Models”选项。在搜索框中输入“deepseek-r1”，找到并点击进入DeepSeek-R1的详情页。选择合适的模型参数版本（如1.5B、7B、14B等），这些参数决定了模型的复杂度和处理能力，就像选择不同马力的引擎。

运行DeepSeek-R1模型

在Ollama的模型详情页中，复制运行模型的命令（如“ollama run deepseek-r1:7b”）。打开电脑的终端（或命令提示符），将命令粘贴到终端窗口中，并按下回车键。等待安装完成后，DeepSeek-R1模型即可在本地运行，随时待命，准备为你提供服务。

（二）RAGFlow搭建个人知识库

RAGFlow是一个基于深度文档理解的开源检索增强生成（Retrieval-Augmented Generation，RAG）引擎，它就像是一个智能的“知识管家”，可以帮助你搭建个人知识库，并利用该知识库进行问答、信息检索等操作。

1. 上传文件到知识库

在RAGFlow系统中，点击上传按钮，选择本地要上传到知识库的文件。支持的文件格式可能包括常见的文档格式（如PDF、DOCX等）、文本文件等。上传时请注意文件格式的支持情况，确保文件能够被正确解析。

2. 配置模型提供商

上传完成后，系统将显示文件的相关信息，如分块数、上传日期、解析方法和解析状态等。在模型提供商配置区域，选择使用的模型提供商（使用DeepSeek模型服务），并将对应的API key粘贴到指定位置。如果选择搭建本地大模型（DeepSeek），也需要在此处进行相应的配置，确保RAGFlow能够与本地模型进行通信和交互。

3. 知识库文件解析与使用

等待知识库文件解析完成后，进入聊天界面。此时，你就可以开始与知识库进行互动了，无论是提问还是检索信息，都能得到精准的答复。

其他工具如下：

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】