该文档围绕 DeepSeek 与华为云合作的 AI 解决方案展开,涵盖了 DeepSeek 的发展历程、技术优势、华为云部署方案以及丰富的应用场景,旨在展示其在 AI 领域的竞争力与商业价值。
DeepSeek 介绍
-
发展历程:2023 年 5 月成立,持续开源,2024 年底发布产品引发全球关注。上线后日活用户、下载量和访问量增长迅速,在多个国家应用商店排名领先,期间还遭受过黑客攻击。
-
技术优势:通过系统优化实现高性能,在数学和编程领域表现突出。如 DeepSeek - V3 训练成本低,仅 558 万美元,推理成本仅为 OpenAI o1 的 3% ,且支持模型蒸馏。技术创新包括绕过 CUDA 挖掘硬件潜力,采用 MOE、MLA 等技术,实现计算、通信优化以及训练和推理加速。
DeepSeek 华为云部署方案
-
场景一:基于 ModelArts Lite/Standard 部署:面向腰部重点客户和模型服务提供商,提供 ModelArts Lite(裸金属服务器)和 ModelArts Standard(Console 平台)两种部署方式,可部署 DeepSeek - R1 和 DeepSeek - V3 全尺寸模型,按包月计费,32 卡起步。
-
场景二:基于 ModelArts Studio 部署:服务于 AI ISV、创业公司和研究院等,提供开箱即用的 MaaS API 服务,支持按需和包月计费,可部署多种模型,包括不同蒸馏版本,根据模型不同卡数要求不同。
-
场景三:基于云服务器私有化部署:针对开发者和企业,在 Flexus 云服务器 X 实例或 GPU 服务器上搭建推理系统,提供多种规格选择,支持按需和包月计费,可部署不同参数规模的蒸馏版模型。
DeepSeek 应用场景
-
联网助手解决方案:基于 Flexus X 实例部署 Dify 工作流平台与 DeepSeek 构建,提升模型落地能力,具备联网搜索和知识库功能,可增强回答准确性,适用于多种客户。
-
智能交互数字人解决方案:结合 DeepSeek、Flexus X 实例、Dify 工作流平台和 MetaStudio,实现数字人具备私域和外部知识,提升多轮对话能力,适用于零售、餐饮等多个行业。
-
智能语音交互 / 智能终端解决方案:由 DeepSeek、Flexus X 实例、Dify 工作流平台和 SIS 语音交互服务构成,可用于智能语音助手和智能终端云底座,实现语音交互和智能决策,适用于电子终端、汽车、玩具等行业的厂商和 ISV。
部署指导
提供了不同场景下部署 DeepSeek 的详细指导文档链接,包括 ModelArts Lite 部署、MaaS 免费 tokens 部署、Flexus X 实例 / GPU 上部署蒸馏版本以及与 Dify 结合的相关部署指导。