4090显卡 + 4张48G内存条台式机部署满血版的DeepSeek

小~小

已于 2025-03-07 11:03:27 修改

阅读量787

点赞数 10

分类专栏：人工智能文章标签：人工智能 DeepSeek

于 2025-03-07 11:03:03 首次发布

本文链接：https://blog.csdn.net/u014196765/article/details/146090458

版权

人工智能专栏收录该内容

46 篇文章

订阅专栏

清华新出的KTransforers方案要部署满血 4bit量化版 DeepSeek需要382GB内存，而我并没有这么大的内存机箱，而我目前有的是4张48G内存条，以及一个配有4090的台式机，那么我可以跑起来吗？
答案是全参1.58bit或者1.73量化版deepseek还是可以尝试下的，经过一个星期努力，终于配置上了满血1.73bit量化版deepseek。

电脑环境

cpu：i9
内存条4个：48G，总共192G
显卡4090，显存24G
在这里插入图片描述

下载 Deepseek-R1 1.58 bit 或者1.73 bit 动态量化版

链接：https://www.modelscope.cn/models/unsloth/DeepSeek-R1-GGUF/summary
在这里插入图片描述
这里我下载的1.73bit，一共158GB左右。有四个文件如下：

llama.cpp配置

下载cmake

下载地址：https://cmake.org/download/
下载msi直接安装，下载zip后需要配置环境变量。

在这里插入图片描述

安装mingw

powershell下执行

Set-ExecutionPolicy RemoteSigned -Scope CurrentUser
iex "& {$(irm get.scoop.sh)} -RunAsAdmin"
scoop bucket add extras
scoop bucket add main
scoop install mingw

这里scoop安装出错，irm : 未能解析此远程名称: 'raw.githubusercontent.com'
解决办法
修改host文件，进入下面目录

C:\Windows\System32\drivers\etc

找到host文件，添加

199.232.68.133 raw.githubusercontent.com

下载llama.cpp代码

git clone https://github.com/ggml-org/llama.cpp.git

更多详细内容，关注下面公众号，回复dp获取

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小~小

关注关注

10
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

AI Agent开发第77课-DeepSeek r1本地安装全指南

打造全国最全的AI Agent开发知识领域的博客

01-30

1万+

本文详细介绍了如何在本地安装deep seek r1。

单双卡4090挑战DeepSeek70B：本地部署效果揭秘

sunly31489的博客

02-07

1万+

然而因为访问人数过多，deepseek的服务器有时候相应不过来，因此把它部署到本地，以便获得更好的体验，作为一名ai爱好者，我最近尝试在单卡和双卡NVIDIA RTX 4090上本地部署了DeepSeek70B，并对其效果进行了实测。这个速度很一般，基本不能使用，生成一篇300字的短文，大概要1分多钟，远远赶不上官方生成的速度。：版本为≥2.0，这是一个基于 Python 的科学计算包，广泛应用于深度学习领域，提供了丰富的工具和库，方便我们进行模型的搭建、训练和部署。在推理速度方面，通过。

参与评论您还未登录，请先登录后发表或查看评论

4090单卡推理Deepseek-R1满血版本，你值得拥有！

qq_43230143的博客

02-24

541

KTransformers 是一种先进的深度学习模型，基于Transformer架构设计，广泛应用于自然语言处理和数据转换任务。它通过引入多头自注意力机制（Multi-Head Self-Attention），有效捕捉输入序列中的长距离依赖关系，从而提升了对复杂上下文的理解能力。与传统Transformer相比，KTransformers在计算效率和模型性能上进行了优化，特别适用于大规模数据集和高维输入场景。

本地部署DeepSeek硬件配置清单，满血版太炸裂了！

最新发布

jennycisp的博客

04-21

1709

这段时间，随着 DeepSeek 影响力的持续破圈，各大算力平台和第三方都在积极支持并上线 DeepSeek。那除此之外，很多小伙伴也在自己的机器上尝试了 DeepSeek 的本地部署。那关于本地部署，之前我们曾分享过一篇文章，是有关 DeepSeek-R1 在本地部署的教程。当时评论区包括私信就有不少小伙伴咨询了有关 DeepSeek-R1 不同版本在部署时所对应的电脑配置要求。有一说一，其实像 DeepSeek-R1 这类模型的本地部署对于硬件配置的要求的确是不低的，尤其是中大模型版本和满血版本。

RTX 4090单卡跑满血版DeepSeek-R1？清华&趋境科技联合推出KTransformers方案！

hunteritself的博客

02-17

4019

RTX 4090单卡跑满血版DeepSeek-R1？清华&趋境科技联合推出KTransformers方案！

DeepSeek安装部署和测试在个人电脑（Windows和Mac）

hellotzx的博客

01-30

4万+

想要深入了解大模型的原理，开发，应用，市场的，也欢迎关注留言，我的团队已经跑通了大模型对个人的市场，欢迎大家加入。后续我会把deepseek的模型训练复现的过程也写到这里，欢迎大家马克关注，也是对我的一种敦促。在mac上的实际测试，安装的是7b模型。除了了资源过载，电脑重启了，第一次碰见。他的回复比较慢，个人笔记本资源不够。问他一个简单问题，“你是谁”运行以上指令，进入以下模式。

DeepSeek 本地部署详细教程

2301_79763109的博客

02-09

1707

通过以上步骤即可完成本地部署。建议将本教程与官方文档结合使用，根据实际硬件环境调整量化参数。部署成功后可通过压力测试工具（如locust）进行性能评估。（此处可插入流程图示意图，文字描述如下）

台式机ddr4内存条序列号修改器-DDR4内存条超频教程-ddr4内存条时序修改工具-ddr4内存条spd烧录器-ddr4内存条开启XMP软件

01-22

台式机DDR4内存条是一代高性能内存技术，其序列号修改器、超频教程、时序修改工具、spd烧录器以及开启XMP软件等工具的出现，极大地方便了硬件爱好者和专业用户对内存条进行深入的调整和优化。DDR4内存条的序列号修改...

DDR4台式机内存条原理图.pdf

06-26

### DDR4 台式机内存条原理图解析 #### 一、概述 DDR4（Double Data Rate 4）是第四代双倍数据速率同步动态随机存取存储器技术，广泛应用于现代个人计算机、工作站和服务器等设备中。DDR4台式机内存条相比其前一代...

DeepSeek-R1 私有化部署 ubuntu22.04 3060显卡

qq_37124515的博客

02-09

1404

实测效果还是可以的，能满足日常使用。但是和“满血”版本还是有很大的差距优先使用官网版本，或者直接使用官网的API版本。如果有空闲资源，官网服务也是不稳定的，可以尝试以上方式部署如果有什么问题，欢迎评论留言讨论，看到会回复如果你觉得这个回答对你有帮助，欢迎关注我的微信公众号【一行梦境】，我会在那里分享更多深度内容和实用技巧。

基础电子中的台式计算机中出现显卡、内存条等接触不良的介绍

11-23

在基础电子领域，台式计算机的维护是必不可少的一部分，尤其是对于显卡和内存条这些关键组件，它们的正常运行直接影响到整个系统的性能和稳定性。本文将深入探讨显卡和内存条接触不良的原因、症状以及解决方案。一...

DDR4内存条原理图及PCB

07-13

DDR4内存条是现代计算机系统中的重要组成部分，它负责存储并快速处理CPU所需的数据。相较于其前一代DDR3，DDR4内存提供了更高的数据传输速率、更低的电压需求以及更大的容量，从而提升了系统的整体性能和能效。以下...

4090单卡部署满血 671B DeepSeek，本地部署“成本骤降32倍”！！！

musicml的博客

02-17

1742

大家好，我是玄姐。正文开始之前，先给我自己打个广告，DeepSeek 爆火国之荣耀，为了回馈粉丝们的支持，原价199元的《基于 DeepSeek 打造的 AI Agent 智能体项目实战直播训练营》，直接降价到19元，今天再开放一天报名特权，仅限99名。回到正题。这个春节，DeepSeek 实在太火爆了。最近，无论是在国内还是国外，一股 DeepSeek-R1 部署热潮正在兴起，许多人都争相在自...

【巅峰算力，静谧之作】4卡4090GPU深度学习“静音”服务器

HPC_Evan的博客

09-23

3579

各位同仁，随着人工智能浪潮的汹涌澎湃，我们正步入一个前所未有的创新纪元。在这个充满挑战与机遇的时代，我愈发频繁地在工作场景中邂逅那些致力于深度学习探索的智者们。他们，对计算力的渴望如同对知识的追求一般，永无止境。鉴于此，我精心筹备了一套即将引领下半年潮流的深度学习服务器配置方案，旨在为您打造一个既静谧又强大的科研伴侣。这不仅仅是一台服务器，它是您智慧探索路上的超级战车，集卓越性能、极致静音与灵活拓展于一身。其设计理念，旨在让您在享受高速运算的同时，彻底告别噪音的侵扰，沉浸在纯粹的科研乐趣之中。

最近爆火的Deepseek如何部署到本地Windows？教程来袭

小白电脑技术的博客

01-29

4万+

最近看到抖音热搜的DeepSeek AI只能很火，很多小伙伴都想部署，但感觉上条件不是很满足，不知道怎样才能搞定它。这不，即使是正月初一，小白也是会正常更新的。今天就来告诉大家怎么在自己的Windows电脑上部署DeepSeek AI人工智能教程！（本教程仅适用于Windows10或以上版本的系统哦！小白使用的是测试机i5- 6600T RAM8GB+ROM120GB的配置，其中的i5-6600T是一半的性能（因为是建立在虚拟机上的，所以性能只有50%，甚至更低。

deepseek 671B 版本推理究竟需要什么样的GPU H100, H20, A6000,TRX 4090

weixin_43480227的博客

02-06

1万+

或者 8卡 80G显存的H800. 可以考虑2.51-bit量化版本预测速度预估20~30TPS (待验证)或者 8卡 40G显存的A6000. 可以考虑2.51-bit量化版本预测速度预估3~10TPS （待验证）基于8卡 24G 显存的4090 全可以考虑1.58-bit版本，预测速度预估3~10TPS （待验证）基于4/ 8卡96G 显存H20 , 预测速度22tps 8张卡每张卡显存占用30。跟进DeepSeek-R1：动手部署671B模型推理（2.51-bit量化）

实战教程：用一张4090显卡+512GB内存部署671B的Deepseek大模型

CSDN_224022的博客

02-22

2764

近日，清华大学MADSys团队正式开源了面向资源受限环境的KTransformers算法框架。基于该框架的技术特性，用户可以在一张4090显卡的设备中部署满血671B的Deepseek。老王看到这个消息非常兴奋，因为这意味着只需要几万块钱就可以实现原本需要百万才能实现的“满血梦”。老王在工作之余，赶紧找了一台设备，实际操练一下，先实现自己的“满血梦”。同时，我把我自己的部署过程记录了下来，供大家参考学习。1、硬件配置系统显卡1*4090内存512GB2、部署ktransformer。

DeepSeek-R1本地部署，再也不怕宕机，还有语音功能！