Linux系统下部署DeepSeek-R1-UD-IQ1_S

weixin_52812174

已于 2025-02-19 11:15:35 修改

阅读量558

点赞数 4

文章标签： linux 运维服务器

于 2025-02-19 10:50:19 首次发布

本文链接：https://blog.csdn.net/weixin_52812174/article/details/145721969

版权

文章目录

配置
部署步骤：
相关问题

配置

两块A100（80GB*2） Linux系统

部署步骤：

1.下载模型文件

从 modelscope 下载模型的 .gguf 文件：

https://www.modelscope.cn/models/unsloth/DeepSeek-R1-GGUF/files

2.安装ollama linux版

下载地址：

https://ollama.com/

1.直接安装，安装命令：

curl -fsSL https://ollama.com/install.sh | sh

2.压缩文件安装
将压缩文件解压到ollama文件夹（自建）：

tar -xvf ollama-linux-amd64.tgz -C ollama

3. 创建 Modelfile 文件，该文件用于指导 ollama 建立模型

1.用vim编辑器，为模型建立模型描述文件。
可根据自身硬件情况调整 num_gpu（GPU 加载层数）和 num_ctx（上下文窗口大小）：

FROM /homeDeepSeek-R1-UD-IQ1_S.gguf  
PARAMETER num_gpu 61  
PARAMETER num_ctx 2048  
PARAMETER temperature 0.6  
TEMPLATE "<｜User｜>{{ .Prompt }}<｜Assistant｜>"

2添加环境变量 PATH ：

export PATH=$PATH:/home/deepseek/ollama/bin
export OLLAMA_MODELS=/home/ollama_models

4. 创建 ollama 模型

1.本地系统上启动 Ollama 服务： ollama serve &
2.在第 3 步建立的模型描述文件所处目录下，执行以下命令：

ollama create DeepSeek-R1-UD-IQ1_S.gguf -f DeepSeekQ1_Modelfile

5. 运行模型

ollama run DeepSeek-R1-UD-IQ1_S.gguf --verbose

6.如下命令查看 ollama 日志

journalctl -u ollama --no-pager

相关问题

1.num_gpu设置为最大61，在进行长文本问答时会崩。
2.num_gpu设置为32时，一块gpu跑满会崩，另一块不跑。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_52812174

关注关注

4
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

24GB GPU 中的 DeepSeek R1：Unsloth AI 针对 671B 参数模型进行动态量化

iCloudEnd的博客

02-04

827

最初的 DeepSeek R1 是一个拥有 6710 亿个参数的语言模型，Unsloth AI 团队对其进行了动态量化，将模型大小减少了 80%（从 720 GB 减少到 131 GB），同时保持了强大的性能。当添加模型卸载功能时，该模型可以在 24GB VRAM 下以低令牌/秒的推理速度运行。

【实战篇】deepseek r1 完全本地部署实战教程

商务合作|问题讨论|交流学习请联系作者微信，加微信请务必注明来意，博客主页有联系方式

02-06

3337

最近 deepseek r1 可是相当火爆，好多小伙伴都想在自己电脑上部署，体验一把强大的 AI 模型。今天咱就来详细讲讲，怎么把 deepseek r1 完完全全部署到本地，新手小白也能轻松上手！

参与评论您还未登录，请先登录后发表或查看评论

deepseek r1模型太大无法本地部署？我有妙招（非蒸馏版）

weixin_42782643的博客

02-20

2634

DeepSeek R1大模型的横空出世，标志着中国AI从追随者跃升为领导者！然而，服务器压力和数据隐私问题催生了本地部署的需求。本文揭秘三种低成本部署方案：1. 官方蒸馏模型，适合个人用户；2. 量化模型，显存>200G的用户可享满血版体验；3. KTransformers，仅需一张4090显卡，内存>380G即可运行满血版R1。AI不再是巨头专属，普通人也能玩转大模型！🚀

Linux+llama.cpp编译+DeepSeek-R1-UD-IQ1_S本地部署

bagepython的博客

02-26

430

提示词处理速度(token/s)输出文本速度(token/s)克隆llama.cpp。treads/线程数。

用Ollama在本地CMD窗口运行deepseek大模型

我驾驶汽车从不是为了从A点到达B点，我喜欢去感受汽车，与之交流，与之融为一体。

02-08

1820

首次运行需要下载deepseek的大模型包（大约5GB，根据本地网速的不同在半个小时到几个小时之间下载完成），并自动运行。第二次运行就直接输入命令。

DeepSeek R1 在 24GB GPU 上：Unsloth AI 对 6710 亿参数模型进行动态量化

m0_59164520的博客

02-11

1685

原始的 DeepSeek R1 是一个拥有 6710 亿参数的语言模型，由 Unsloth AI 团队采用动态量化技术处理，实现了 80% 的体积缩减 —— 从 720GB 缩小到最低 131GB —— 同时保持了强劲的性能。当加入模型卸载（offloading）后，该模型可以在 24GB 显存的环境下运行，并实现低 token/s 的推理速度。

DeepSeek R1模型的本地部署教程（非常详细）DeepSeek本地部署教程，收藏这一篇就够了！

资深程序员，曾自学JAVA，C#，如今从业于网安行业

02-25

1498

2025年新春，科技界迎来了一则重磅消息：DeepSeek开源发布了R1版本。尽管这是一个经过蒸馏的“小模型”（相较于大模型的参数量和训练算力需求），但其表现却能与OpenAI-O1-min相媲美。大模型的功能强大，但是高昂的部署和应用门槛依旧让普通人望而却步，如今的DeepSeek R1模型的各种蒸馏版本可以说真正让大模型“飞入寻常百姓家”了。那么，为什么要尝试本地部署开源大模型，比如DeepSeek呢？因为使用本地模型具有诸多优势：所有数据处理都在本地运行，无需上传至云端，保障隐私数据安全。

一文速览DeepSeek-R1的本地部署——可联网、可实现本地知识库问答

最新发布

03-24

wget https://huggingface.co/unsloth/DeepSeek-R1-GGUF/tree/main/DeepSeek-R1-UD-IQ1_S/DeepSeek-R1-671B-IQ1_S.gguf ``` > 注：可选择 `IQ4_XS` 等低精度量化版本以降低硬件需求。 --- ##### 2. 安装运行...

在Linux系统环境中，怎么接入满血deepseek-R1

02-26

allow_patterns=["*UD-IQ1_S*"] ) ``` 这段代码会安装必要的库，并设置环境变量以启用更快的数据传输功能[^3]。 #### 启动 KubeRay Operator 对于集群管理部分，需先初始化 Kubernetes 上运行的服务。这涉及到 ...

DeepSeek掘金——在CPU上运行DeepSeek-R1

02-24

3645

在 CPU 上运行 LLM 提供了一种扩大可访问性的替代方案，允许更多用户在现有硬件上利用 AI。本指南探讨了在 CPU 上有效使用 DeepSeek R1 的方法。随着对 AI 驱动应用程序的需求不断增长，大型语言模型 (LLM) 已成为各个领域的重要工具。然而，大多数这些模型都需要强大的 GPU 才能有效运行，这使得许多用户无法使用它们。并不是每个人都能买得起高端 GPU，而且从长远来看，云服务的成本可能很高。

完整的671B R1塞进本地，详尽教程来了！

2301_81888214的博客

02-04

5234

DeepSeek R1 671B 完整版本地部署教程来了！！！

weixin_59191169的博客

02-05

1万+

关于本地部署，大多数人使用的是蒸馏后的8B/32B/70B版本，本质是微调后的Llama或Qwen模型，并不能完全发挥出DeepSeek R1的实力。然而，完整的671B MoE模型也可以通过针对性的量化技术压缩体积，从而大幅降低本地部署门槛，乃至在消费级硬件（如单台Mac Studio）上运行。那么，如何用 ollama 在本地部署 DeepSeek R1 671B（完整未蒸馏版本）模型呢？一篇在海外热度很高的简明教程即将揭晓。作者主页：https://snowkylin.github.io。

完整DeepSeek-R1 671B本地化部署，详尽教程来了！

Y525698136的博客

02-05

2853

在刚刚过去的春节期间，DeepSeek 成为了人工智能领域的焦点，其强大功能赢得了广泛好评。然而，真正的独家定制体验，需要将模型部署到本地。本文详细介绍了使用Ollama在本地部署DeepSeek R1的全流程，帮助各位读者搭建专属的智能助手。

完整的671B DeepSeek R1本地部署，详尽教程来了！

嘴巴吃糖了

02-06

8227

过年这几天，DeepSeek 算是彻底破圈了，火遍大江南北，火到人尽皆知。虽然网络版和 APP 版已经足够好用，但把模型部署到本地，才能真正实现独家定制，让 DeepSeek R1 的深度思考「以你为主，为你所用」。然而，完整的 671B MoE 模型也可以通过针对性的量化技术压缩体积，从而大幅降低本地部署门槛，乃至在消费级硬件（如单台 Mac Studio）上运行。

满血版DeepSeek R1 671B本地部署完成，可以快乐的玩耍了

2401_85390073的博客

02-12

1927

在前面一周通过深度使用DeepSeek之后，简直被其的能力所震撼，在之前所有的AI大模型问答系统中，都是用户给定一个提示词问题，然后AI回复问题，而DeepSeek令我感觉很Nice点在于它可以进行思维链模式的深度思考问题，并把这个问题的思考表达过程展示出来，其实，不知道大家有没有想过一个问题，有时候问题答案已经不重要了，大模型的深度思考本身的内容就值得我们进行学习，我觉得这个是非常能够提升人思考水平和表达能力的一个功能。

一文搞懂DeepSeek - 开源模型R1

m0_65555479的博客

01-27

8143

*在多个基准测试中，DeepSeek-R1的表现优于或接近OpenAI o1。**）是什么？**********DeepSeek系列模型有哪些？******：一款在数学、代码及自然语言推理领域与OpenAI o1比肩的开源大模型，以其全面、详实的回答和结构化输出著称。**DeepSeek-V3：**凭借自研MoE模型和671B参数，在性能上超越所有已发布的开源模型，成为极具性价比的顶尖大模型之一。：专为视觉和语言理解设计的开源多模态模型，能够处理复杂场景下的逻辑、公式识别及自然图像等问题。

DeepSeek-R1-UD-IQ1_S 12GB

02-10

### 关于 DeepSeek-R1-UD-IQ1_S 12GB 技术规格和相关信息 #### 文件和技术细节 DeepSeek-R1-UD-IQ1_S 是一种特定配置下的模型文件，其大小约为 12 GB。此版本属于 DeepSeek R1 系列的一部分，该系列专注于提供高效能的语言处理能力[^1]。对于希望部署这一模型的应用场景而言，可以利用 `llama.cpp` 工具来管理和操作这些大型模型文件。例如，通过指定路径并执行相应命令可实现多个分片权重文件的合并工作： ```bash ./llama.cpp/llama-gguf-split --merge \ DeepSeek-R1-GGUF/DeepSeek-R1-UD-IQ1_S-00001-of-00003.gguf \ merged_file.gguf ``` 上述脚本展示了如何将分割后的权重重新组合成单个完整的 `.gguf` 文件格式[^2]。 #### 获取与安装指南为了便于开发者快速上手使用此类预训练好的量化模型，在线平台 Hugging Face 提供了一个便捷的方式来进行下载。具体来说，可以通过 Python 库 `huggingface_hub` 中提供的函数轻松完成目标模型文件的获取过程。下面给出了一段用于下载名为 "DeepSeek-R1-Distill-Qwen-7B" 的蒸馏版大模型实例代码片段；而对于其他变体如 DeepSeek-R1-UD-IQ1_S，则只需调整参数即可适用相同逻辑: ```python from huggingface_hub import snapshot_download snapshot_download( repo_id="deepseek-ai/DeepSeek-R1-Distill-Qwen-7B", allow_patterns=["*.gguf"] ) ``` 这段程序会自动从仓库中拉取匹配模式的所有资源到本地环境当中去[^3]。