手把手教你本地部署DeepSeek-R1:7B与RAGFlow智能文档问答系统

最新推荐文章于 2025-04-27 17:36:49 发布

水果623

最新推荐文章于 2025-04-27 17:36:49 发布

阅读量1.3k

点赞数 20

文章标签： deepseek RAGFlow

本文链接：https://blog.csdn.net/u011389297/article/details/145876835

版权

在这里插入图片描述

前言

在本地部署大型语言模型已成为企业构建私有AI解决方案的新趋势。本文将详细介绍如何通过Ollama框架部署国产明星模型DeepSeek-R1-7B，并搭建RAGFlow实现智能文档问答系统。整个过程仅需消费级GPU即可完成。

第一部分：Ollama部署DeepSeek-R1-7B

环境准备

推荐配置：NVIDIA RTX 3090/4090 (24G显存)
系统要求：Ubuntu 20.04+ / Windows WSL2

依赖安装：

sudo apt-get install -y nvidia-driver-535 cuda-12.2

步骤1：安装Ollama

curl -fsSL https://ollama.com/install.sh | sh
ollama serve  # 启动服务（默认端口11434）

步骤2：部署DeepSeek-R1-7B

创建自定义Modelfile：

FROM ~/models/deepseek-r1-7b.Q4_K_M.gguf  # 需提前从HuggingFace下载
PARAMETER num_ctx 4096
PARAMETER num_gpu 35
SYSTEM """
你是一个专业的人工智能助手，遵循严谨的技术文档处理规范...
"""

启动模型：

ollama create deepseek-r1 -f Modelfile
ollama run deepseek-r1

验证部署

import requests

response = requests.post(
    "http://localhost:11434/api/generate",
    json={
        "model": "deepseek-r1",
        "prompt": "解释梯度下降算法",
        "stream": False
    }
)
print(response.json()["response"])

第二部分：RAGFlow对接DeepSeek-R1-7B

1. 安装RAGFlow

docker run -d --name ragflow \
  -p 10080:10080 \
  -v /data/ragflow:/opt/ragflow \
  infiniflow/ragflow:latest

2. 配置模型接入

修改/data/ragflow/config.yaml：

llm:
  local:
    api_base: "http://host.docker.internal:11434"
    model_name: "deepseek-r1"
    api_type: "ollama"

3. 构建知识库

通过Web界面（http://localhost:10080）：

创建"技术文档"知识库
上传PDF/Word/TXT格式文档
选择chunk策略（推荐512 tokens）

第三部分：智能问答实战

测试案例：法律文档解析

Q: 根据上传的《网络安全法》，个人信息泄露事件需要在多少小时内报告？

DeepSeek-R1+RAGFlow响应：
根据《网络安全法》第四十二条规定，发生个人信息泄露、毁损、丢失的事件时...

性能优化建议

使用量化版本提升推理速度：
```
ollama run deepseek-r1:7b-q4_k_m
```

调整RAGFlow检索参数：

retrieval:
  top_k: 3
  score_threshold: 0.65

常见问题排查

问题现象	解决方案
OOM错误	添加`--num-gpu-layers 20`减少显存占用
响应速度慢	使用`ollama run deepseek-r1:7b-q2_k` 2bit量化版本
RAGFlow连接超时	在docker run命令添加`--add-host=host.docker.internal:host-gateway`