【LLM】基于 Ollama 部署 DeepSeek-R1 本地大模型

RumIV

已于 2025-04-30 11:40:39 修改

阅读量1k

点赞数 32

分类专栏： # LLM 文章标签： python

于 2025-04-30 10:33:34 首次发布

本文链接：https://blog.csdn.net/qq_40205510/article/details/147626359

版权

本文详细介绍如何在 Linux 和 Windows 环境下，通过 Docker Compose 整合 Ollama 和 Open WebUI，部署 DeepSeek-R1 大语言模型，并提供 GPU 加速支持。无论你是开发者还是 AI 爱好者，均可通过本指南快速搭建私有化 GPT 环境。

一、环境准备

1. Docker 与 Docker Compose 安装

Linux
通过官方脚本安装 Docker 及 Docker Compose：

curl -fsSL https://get.docker.com | sh
sudo systemctl enable --now docker
sudo curl -L "https://github.com/docker/compose/releases/latest/download/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
sudo chmod +x /usr/local/bin/docker-compose

Windows
下载 Docker Desktop 并安装，确保启用 WSL2 后端和 Linux 容器模式。

2. GPU 支持（可选）

若需 GPU 加速，需安装 NVIDIA Container Toolkit（Linux）或配置 Docker Desktop GPU 支持（Windows）：

Linux
参考 NVIDIA 官方指南安装工具包：

sudo apt-get install -y nvidia-container-toolkit
sudo systemctl restart docker

Windows
确保安装 CUDA 驱动并启用 Docker Desktop 的 GPU 支持（设置 > Resources > WSL Integration）。

二、Ollama 的安装与启动

1. 直接安装方式

Linux
下载二进制文件并运行：

curl -L https://ollama.com/download/ollama-linux-amd64 -o ollama
chmod +x ollama
./ollama serve

Windows

Windows平台推荐使用官网安装包直接安装 ollama

从

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

RumIV

关注关注

32
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Ollama+deepseek-r1-1.5b+chatbox本地部署

m0_37651448的博客

02-05

661

1. Ollama+deepseek-R1-1.5B+chatbox本地部署 2. vscode+cline+ollama+deepseek-R1辅助编程

Ollama本地部署DeepSeek-R1:14b完全指南

m0_65555479的博客

02-06

9591

创建一个名为Modelfile通过本指南的步骤，您应该已经成功在本地部署了DeepSeek-R1:14b模型。记住，模型的性能表现会受到硬件配置和参数设置的影响，建议根据实际使用情况进行适当调整。如果遇到问题，可以参考上述故障排除部分，或访问Ollama的官方文档获取更多帮助。祝您使用愉快！

参与评论您还未登录，请先登录后发表或查看评论

本地部署DeepSeek-R1模型（新手保姆教程）

weixin_46277779的博客

02-03

3万+

本地部署deepseek-r1模型调用，新手保姆教程，无需代理

DeepSeek-R1本地部署，再也不怕宕机，还有语音功能！

热门推荐

2401_84204207的博客

01-29

6万+

最近国产大模型DeepSeek特别火，以至于频繁出现反应迟缓甚至宕机的情况，和两年多之前ChatGPT的遭遇颇为相似。万幸，DeepSeek是一个开源模型，我们大可以通过本地部署，在自己的终端上随时使用！接下来就教大家具体的操作：**一、用Ollama下载模型**首先我们需要安装Ollama，它可以在本地运行和管理大模型。

Ollama部署deepseek-r1蒸馏模型

lybigdate的博客

01-29

2738

是一款开源的大型语言模型（LLM）服务工具，旨在简化大语言模型的本地部署和使用流程。它支持在 Windows、Linux 和 macOS 上运行，能够快速部署包括 Llama、Falcon、Qwen 等在内的 1700+ 大语言模型，满足不同用户的需求。Ollama 提供了丰富的功能，包括本地运行、多模型支持、自定义模型配置、多 GPU 并行推理以及兼容 OpenAI 接口等。用户可以通过简单的命令行操作或图形界面进行模型的下载、启动和管理，同时还可以利用其 API 接口将模型集成到各种应用程序中。

【DeepSeek】在本地计算机上部署DeepSeek-R1大模型实战（完整版）

Morse_Chen的博客

02-11

2万+

本文介绍了如何在本地计算机上部署DeepSeek R1大模型，重点讲解了数据隐私、定制化、离线使用等优势，并提供了简便的安装步骤，适合普通用户和开发者，推动AI技术的普及与便利性。

ollama 部署 deepseek-r1 70B 模型完整指南

2401_85325726的博客

02-24

1285

Ollama运行界面。

Ollama之DeepSeek-R1大模型本地安装与使用

yuanjinshenglife的专栏

02-11

774

Ollama之DeepSeek-R1大模型本地安装与使用

Windows下最详尽的Ollama+Deepseek-r1 本地部署手册

huang9604的博客

02-05

2万+

Windows下最详尽的Ollama+Deepseek-r1 本地部署手册

本地内网，部署Ollama与DeepSeek-R1大模型实践指南

2401_84495872的博客

02-25

885

参数规模为15亿，模型大小约4GB。：参数规模为70亿，模型大小约15GB。：参数规模为80亿，模型大小约16GB。：参数规模为140亿，模型大小约30GB。：参数规模为320亿，模型大小约75GB。：参数规模为700亿，模型大小约140GB。这些子模型在满足不同应用场景需求的同时，也为个人部署提供了更多选择。

大模型部署实战：基于Ollama + DeepSeek-R1 + OpenAI的混合架构

qq_32358423的博客

02-14

1753

在AI技术快速发展的今天，大语言模型（LLM）已成为开发者工具箱中的核心组件。然而，直接依赖云端API（如OpenAI）可能面临成本、隐私和延迟等问题。（OpenAI），我们可以构建灵活、可控且高性价比的混合架构。本文将手把手教你实现这一方案。无论是个人项目还是企业应用，这套方案都能为你提供强大的AI能力支撑。

Windows本地部署DeepSeek-R1大模型实战：基于Ollama的极简指南

TKang8912的博客

02-03

5800

准备训练数据（JSONL格式）{"text": "<用户指令>优化客服话术</指令><响应>..."}# 启动微调部署效果评估响应速度：CPU模式约15 tokens/s，RTX4090可达85 tokens/s内存占用：7B量化版约5.8GB，完整版需18GB知识截止：2023年10月（可通过微调更新）最佳实践建议日常使用选择4-bit量化版本复杂任务启用GPU加速长期运行建议配置为Windows服务敏感业务数据启用TLS加密传输。

Ollama 部署 DeepSeek-R1 本地模型

qq_34185638的博客

02-01

3768

Ollama 是一个快速、轻量且易于使用的开源 AI 代理框架，由 Facebook 开发，可以用来托管和运行各种语言模型（LLM），可以实现在您的硬件设备快速部署各种本地大模型，并且提供了一个简单命令行界面，方便用户快速部署。既然现在已经了解了 Ollama是干嘛的，那么接下来就是在你的操作系统中安装 Ollama了。

DeepSeek-R1私有化部署——基于Ollama与FastApi部署DeepSeek-R1-Distill-Qwen服务器

知来者逆的博客

03-04

766

在前面的博客中，介绍了基于python私有化部署了DeepSeek-R1-Distill-Qwen的命令行对话与服务器客服端访问的方式，这两种方法都要基于torch算法框架，安装时还要对应torch的版本，假设安装的torch的版本小2.2,那么可以加载模型时可能获取到"triu_tril_cuda_template" not implemented for 'BFloat16'这个错误。

【记录】Python调用大模型（以Deepseek和Qwen为例）

最新发布

weixin_44194088的博客

04-29

249

预备（以BERTopic聚合主题为例）

用Java模拟打字：深入解析 java.awt.Robot 的键盘控制艺术

码觉客的博客

04-28

2004

通过，我们可以实现强大的键盘自动化功能。对于简单的字符（英文字母、数字、基础标点等），可以通过模拟单个按键的按下和释放（可能需要配合 Shift 等修饰键）来实现，这需要建立字符到键码的映射并注意按键时序和延迟。对于复杂字符、中文或长文本，由于Robot不理解输入法逻辑，最可靠和常用的方法是将文本复制到系统剪贴板，然后模拟按下系统的粘贴快捷键。无论使用哪种方法，理解Robot的工作原理（模拟物理按键），处理好窗口焦点，并加入适当的延迟，是确保模拟输入成功的关键。虽然Robot。

python可视化艺术：VPython实现大物理模型

2301_80338712的博客

04-27

589

量子力学是现代物理学的基石，但其抽象概念往往难以理解。我们的第一个模拟通过可视化氢原子中电子的量子波函数，使这一微观世界变得可见。流体力学在工程、气象和医学领域有广泛应用。第二个模拟使用SPH（光滑粒子流体动力学）方法，展示了流体的复杂行为。宇宙尺度的天体物理学是现代科学最前沿的领域之一。我们的第三个模拟展示了星系环绕中央超大质量黑洞的形成和演化过程。VPython将强大的3D可视化能力与Python的简洁语法相结合，为科学教育和研究提供了绝佳工具。

Python项目--基于计算机视觉的手势识别控制系统

exlink2012的专栏

04-23

2935

随着人机交互技术的快速发展，传统的键盘、鼠标等输入设备已经不能满足人们对自然、直观交互的需求。手势识别作为一种非接触式的人机交互方式，具有操作自然、交互直观的特点，在智能家居、游戏控制、虚拟现实等领域有着广泛的应用前景。本项目旨在开发一个基于计算机视觉的手势识别控制系统，通过摄像头捕获用户的手部动作，实时识别手势类型，并将识别结果转化为相应的控制命令，实现对计算机或其他设备的非接触式控制。

京东商品详情API数据爬取难度分析与解决方案

Asher18870278351的博客

04-28

821

京东商品数据爬取是一项技术要求高、维护成本大的工程，需要综合运用网络爬虫、密码学分析和分布式系统等多领域知识。成功的爬虫系统需要在技术实现、资源投入和合规边界之间找到平衡点。随着电商平台安全技术的不断升级，爬取方也需要持续迭代技术手段，同时更应关注数据获取的合法合规性。

java 基于 Ollama 部署 DeepSeek-R1

02-19

### 部署DeepSeek-R1模型于Java项目中对于希望集成DeepSeek-R1模型到Java项目的开发者而言，直接利用Ollama作为中介工具并非标准路径。通常情况下，部署此类大型语言模型（LLM）涉及多个阶段的工作流程，包括但不限于准备运行环境、加载预训练模型以及构建API接口以便其他应用程序调用。 #### 准备工作鉴于目标是在Java环境中操作，首先需确保基础架构支持必要的依赖项安装与配置。虽然原生的RKNN SDK主要面向Python用户提供便利[^1]，但借助JNI(Java Native Interface)或其他桥接方案可以间接达成目的。具体来说： - 安装JDK并设置好JAVA_HOME环境变量； - 使用Maven或Gradle管理第三方库； - 考虑引入像TensorFlow Java这样的框架来简化机器学习任务执行过程； #### 加载模型由于官方文档并未提及针对Java的具体指导说明，因此可能需要先将DeepSeek-R1转换为目标平台兼容的形式。一种可行的方法是从GitHub仓库克隆`rknn-llm`资源后，在本地编译适用于ARM架构处理器（如RK3588/RK3576系列芯片组）上的推理引擎版本。接着通过C/C++编写适配层，使其能够被Java程序所调用。 ```java public class ModelLoader { static { System.loadLibrary("native-lib"); // 假设已存在对应.so文件 } public native void loadModel(String path); public native float[] predict(float[] input); } ``` 请注意上述代码仅为示意性质，实际应用时还需考虑更多细节问题，比如内存管理和错误处理机制等。 #### 构建服务端口为了使Java客户端更容易访问该功能模块，建议封装RESTful Web Service形式的服务端点。这可以通过Spring Boot快速实现，并允许外部系统以HTTP请求的方式发起预测任务。 ```yaml server: port: 8080 spring: application: name: deepseek-r1-service ``` ```java @RestController @RequestMapping("/api/v1/deepseek") public class PredictionController { @Autowired private ModelLoader loader; @PostMapping("/predict") ResponseEntity<Object> predict(@RequestBody Map<String, Object> payload){ try{ Float[] inputData = (Float[])payload.get("input"); float[] result = loader.predict(Arrays.stream(inputData).mapToDouble(Float::doubleValue).toArray()); return new ResponseEntity<>(result, HttpStatus.OK); }catch(Exception e){ logger.error(e.getMessage(),e); throw new RuntimeException("Prediction failed",e); } } } ``` 尽管如此，考虑到当前资料集中并没有关于如何确切地把Ollama融入此场景下的明确指示[^2]，以上描述仅提供了一种理论层面的技术路线图。实践中或许还需要进一步探索适合特定业务需求的最佳实践方式。