十分钟搭建属于自己的 DeepSeek 知识库！完全开源、离线部署方案详解

AI仙人掌

已于 2025-03-26 13:43:32 修改

阅读量1.5k

点赞数 18

分类专栏：人工智能文章标签：人工智能 RAG DEEPSEEK ai 知识库

于 2025-02-11 15:12:20 首次发布

本文链接：https://blog.csdn.net/qq_36603091/article/details/145572441

版权

人工智能专栏收录该内容

87 篇文章

订阅专栏

还在为担心公司机密文档上传到云端吗？本教程将带你使用完全开源的工具，在本地搭建一个基于 RAG (Retrieval-Augmented Generation) 技术的智能知识库系统。不仅完全离线，还能保护隐私，让你的文档秘密更有保障！
在这里插入图片描述

🛠️ 环境准备

在开始之前，请确保你的系统满足以下要求：

操作系统：Linux/macOS/Windows
RAM：至少 8GB (推荐 16GB 以上)
硬盘空间：至少 20GB 可用空间
已安装：
- Docker & Docker Compose v2.0+
- Ollama

1. 安装 Ollama

访问 Ollama 官网下载并安装对应系统版本
验证安装：

ollama --version

2. 下载必要的模型

我们需要两个模型：

deepseek-r1:7b 用于对话生成
nomic-embed-text 用于文本向量化

执行以下命令下载模型：

# 下载对话模型
ollama pull deepseek-r1:7b

# 下载向量模型  
ollama pull nomic-embed-text

🔧 部署知识库系统

1. 克隆项目

git clone https://github.com/rag-web-ui/rag-web-ui.git
cd rag-web-ui

2. 配置环境变量

复制环境变量模板并编辑：

cp .env.example .env

编辑 .env 文件，配置如下：

# LLM 配置
CHAT_PROVIDER=ollama
OLLAMA_API_BASE=http://host.docker.internal:11434
OLLAMA_MODEL=deepseek-r1:7b
# Embedding 配置
EMBEDDINGS_PROVIDER=ollama
OLLAMA_EMBEDDINGS_MODEL=nomic-embed-text

# 向量数据库配置
VECTOR_STORE_TYPE=chroma
CHROMA_DB_HOST=chromadb
CHROMA_DB_PORT=8000

# MySQL 配置
MYSQL_SERVER=db
MYSQL_USER=ragwebui
MYSQL_PASSWORD=ragwebui
MYSQL_DATABASE=ragwebui

# MinIO 配置
MINIO_ENDPOINT=minio:9000
MINIO_ACCESS_KEY=minioadmin
MINIO_SECRET_KEY=minioadmin
MINIO_BUCKET_NAME=documents

注意：这里使用的是 Docker Compose 的服务名而不是 localhost，这样容器之间才能正确通信。