DeepSeek部署全攻略：四大方案详细解析

玦尘❀

已于 2025-05-20 20:15:54 修改

阅读量6.7k

点赞数 42

分类专栏： AI大模型文章标签： DeepSeek 本地部署 ollama Cherry Studio

于 2025-02-13 22:08:44 首次发布

本文链接：https://blog.csdn.net/weixin_74199893/article/details/145616653

版权

AI大模型专栏收录该内容

3 篇文章

订阅专栏

前言

最近 AI 技术越来越火，很多公司和开发者都想在自己的应用里加入 AI 功能。DeepSeek 是一个性价比很高的 AI 平台，提供了多种部署方式，适合不同需求的用户。不管你是个人开发者、小团队，还是大公司，DeepSeek 都能帮你找到合适的解决方案。

这篇文章会详细讲解 DeepSeek 的四种主要部署方式：API 调用、模型推理服务器、本地部署和混合云部署。我们会分析每种方式的优缺点、费用和适用场景，帮你选出最适合的方案。无论你是刚接触 DeepSeek，还是想优化现有的部署，这篇文章都会给你实用的建议。

在这里插入图片描述

方案一：调用 API + DeepSeek 服务器

1. 方案简介

此方案通过调用 DeepSeek 提供的 API，直接利用其服务器进行推理任务。可以选择开发自有应用，或者使用 DeepSeek 官方推荐的客户端进行集成，例如：DeepSeek 官方推荐集成方式。

2. 费用说明

DeepSeek API 采用按 Token 计费的方式，价格如下：

普通模型（DeepSeek-V3）
- 输入：每百万 tokens 0.5 元（缓存命中）/ 2 元（缓存未命中）
- 输出：每百万 tokens 8 元

在这里插入图片描述

推理模型（DeepSeek-VL）
- 输入：每百万 tokens 1 元（缓存命中）/ 4 元（缓存未命中）
- 输出：每百万 tokens 16 元

在这里插入图片描述

3. 方案优缺点分析

优点

✅ 低部署成本：无需购买高性能服务器，直接调用 API 即可使用。
✅ 维护压力小：DeepSeek 服务器负责模型维护、升级，无需自行优化推理性能。
✅ 高效迭代：可以快速集成到现有应用，减少开发周期。
✅ 价格相对低廉：相比其他大模型 API（如 OpenAI GPT），DeepSeek 的 API 价格更具竞争力。
✅ 可选缓存优化：如果请求可以缓存命中，成本更低，适用于高重复请求场景。

缺点

❌ 受 API 限制：目前DeepSeek服务器资源紧张，API调用受到限制。
❌ 延迟不可控：由于 API 调用需要网络传输，相比本地推理存在额外的网络延迟。
❌ 数据安全性：输入数据需要发送至 DeepSeek 服务器，可能涉及隐私或数据合规问题。
❌ 依赖服务稳定性：如果 DeepSeek 服务器出现故障或 API 调整，可能影响应用的可用性。

4. 实战演示

首先打开DeepSeek官网，然后找到API开放平台：
点击左侧API Keys按钮，创建API key并复制：

注意：API key 仅在创建时可见可复制，请妥善保存。不要与他人共享你的 API key，或将其暴露在浏览器或其他客户端代码中。

复制成功以后，随便找一个客户端打开（这里以Cherry Studio为例）：

Cherry Studio安装简单，这里就不再过多赘述了。

在这里插入图片描述

按下图操作步骤依次操作即可：
接下来就可以使用DeepSeek的模型啦，但是由于近期DeepSeek服务频频崩溃，为确保普通用户的正常访问，所以DeepSeek暂时停用了API服务。

方案二：第三方平台（秘塔搜索、硅基流动）

1. 秘塔搜索

网址： https://metaso.cn/
在这里插入图片描述

在这里插入图片描述

优点：满血版R1，操作方便
缺点：无法关闭联网搜索

2. 硅基流动

网址：https://siliconflow.cn/zh-cn/models

使用流程：

注册账号。用手机号注册即可，新注册的账号有免费的2000token可以使用。
选择R1模型：
两种配置方式：

在线体验
调用API：
- 创建API密钥
- 复制API密钥
- 下载与安装客户端工具
  DeepSeek 官方推荐了多款集成工具，帮助用户更方便地与 DeepSeek 模型进行交互。详细的集成工具列表可以查看官方 GitHub 页面：DeepSeek 集成工具。
  其中，推荐使用的客户端工具是 Cherry Studio，这是一款功能强大的 AI 开发工具，能够简化 DeepSeek 模型的集成与调试工作。你可以通过以下链接访问并下载： Cherry Studio 官网。
  需要注意的是，由于该工具是从 GitHub 下载的，部分地区可能会遇到无法直接访问的情况。对此，你可以选择使用梯子进行下载，或者直接使用我们提供的离线包进行安装，避免网络限制带来的不便。
  安装过程非常简单，Cherry Studio 傻瓜式安装向导，用户只需按照提示一步步操作即可完成安装。
- 配置API密钥
- 选择模型
  
  缺点：花完送的token，再想用就需要充值了。
- 充值操作：使用Pro的满血R1需要充钱，交互等待时长比普通的R1赠送的。想要充值的话，首先进行实名认证，后续正常支付即可。

3. 其他平台

百度千帆
- 链接: 百度千帆平台
- 描述: 提供AI模型的训练、推理和管理服务，适合企业开发AI应用。
阿里云PAI
- 链接: 阿里云PAI平台
- 描述: 阿里云的人工智能平台，支持机器学习、深度学习和大数据分析，可以快速创建AI模型。
腾讯云 TIONE
- 链接: 腾讯云 TIONE平台
- 描述: 提供AI模型的训练和部署平台，支持DeepSeek等AI解决方案。
Cursor
- 链接: Cursor
- 描述: 需要订阅Cursor会员才能使用的高效AI助手，适合开发者使用。
Grok
- 链接: Grok官网
- 描述: 提供基于Grok硬件的AI计算平台，主打高效的推理计算，支持蒸馏版的Llama 70B模型，但中文能力有限。
国家超算中心
- 链接: 国家超算中心
- 描述: 提供强大的计算资源和AI模型训练环境，适合科研和企业级应用。

方案三：本地算力部署（基于ollama）

1. 版本选择

简单来说，本地部署DeepSeek-R1模型就是让你在自己的电脑或服务器上运行这个模型，不需要联网。最大的问题是，这个模型非常大，尤其是DeepSeekR1671B（满血版），文件大小能达到720GB，普通电脑或公司服务器很难满足这种硬件需求。

不过，这种方式特别适合那些对数据隐私要求极高的地方，比如保密单位或敏感行业，因为他们需要确保数据完全在本地处理，避免泄露风险。虽然硬件要求高，但好处是不用联网，完全自主控制。

使用蒸馏版：:https://huggingface.co/deepseek-ai

在这里插入图片描述

简单来说，DeepSeek 开源了2个主要模型和6个简化版模型。R1预览版和正式版的参数高达660B（非常大），普通公司根本用不起。为了让更多人能用，他们通过“蒸馏”技术压缩出了6个小模型，最小的只有1.5B参数，10G显存就能跑，适合普通用户。

如果你想在个人电脑上部署，通常会选择其他架构的简化模型，比如基于Llama或Qwen微调的版本，参数一般在32B以下。不过，这些简化版模型无法完全发挥DeepSeek R1的全部能力，算是性能和硬件需求之间的折中方案。

2. 部署过程

现在很多人喜欢用 Ollama（https://ollama.com/）来在本地运行大模型。Ollama 可以理解为一个本地版的“服务器”，用来托管和运行模型。你可以在它的模型库（https://ollama.com/library）里选择各种模型，然后在本地运行。

然后，你可以搭配一些前端工具来使用，比如 ChatBox、Cherry Studio（https://chatboxai.app/zh），或者其他工具，比如 Chrome 插件 PageAssist 或 AnythingLLM。

两者结合就能在本地轻松玩转大模型了！

步骤1:下载ollama

在这里插入图片描述

步骤二：安装Ollama

我这里用的是macOS版本，安装完成之后，在终端输入命令检验是否安装成功：

ollama -v

在这里插入图片描述
能显示ollama版本说明安装成功。

步骤三：选择R1模型

在这里插入图片描述

步骤四：选择版本

在这里插入图片描述

7B代表70亿参数，而671B经过HuggingFace的4-bit标准量化后，大小为404GB。由于它支持CPU和GPU混合推理，系统的“总内存空间”可以近似为内存和显存的总和。如果你想运行这个404GB的671B模型，建议你的内存和显存加起来能达到500GB以上。

除了模型本身所需的内存和显存外，运行时还需要额外的空间来缓存上下文。缓存空间越大，支持的上下文窗口也越大。因此，根据你电脑的配置，选择适合的模型版本非常重要。如果你想运行404GB的671B，建议你的系统有足够的内存和显存，而7B版本则适用于大多数电脑，通常可以顺利运行。这里就以7b为例：

在这里插入图片描述