DeepSeek-V3 开源模型 671B (真正的DeepSeek训练模型) 大约需要8张H200 英伟达显卡 (单张显存141GB) .
NVIDIA H200 GPU 是一款高端的 Tensor Core GPU,专为高性能计算(HPC)和人工智能(AI)工作负载设计。以下是其主要参数和市场定价信息:
参数
-
显存容量:
- H200 GPU 搭载了 141GB HBM3e 显存,相比前代 H100 的 80GB 显存容量几乎翻倍。
- 显存带宽高达 4.8TB/s,是 H100 的两倍以上。
- H200 GPU 搭载了 141GB HBM3e 显存,相比前代 H100 的 80GB 显存容量几乎翻倍。
-
计算性能:
- FP64 性能为 34 TFLOPS(H200 SXM)或67 TFLOPS(H200 NVL)。
- FP32 性能为 53 TFLOPS(H200 SXM)或106 TFLOPS(H200 NVL)。
- FP16 性能为 106 TFLOPS(H200 SXM)或212 TFLOPS(H200 NVL)。
- TF32 性能为 212 TFLOPS(H200 SXM)或424 TFLOPS(H200 NVL)。
-
内存带宽:
- H200 的内存带宽为 4.8TB/s,是 H100 的两倍。
-
功耗:
- H200 SXM 的最大热设计功耗(TDP)为 700W,而 H200 NVL 的 TDP 为600W。
-
多实例 GPU (MIG):
- 支持将单个 H200 GPU 划分为多个 MIG 单元,每个单元最多支持 18 个 GPU,适用于不同规模的工作负载。
-
接口与连接性:
- 支持第四代 NVLink,带宽可达 900GB/s。
- 支持 PCIe 5.0 接口。
-
适用场景:
- 适用于生成式 AI、大型语言模型(LLM)、科学计算、深度学习训练和推理等高性能计算任务。
市场价格
关于 NVIDIA H200 GPU 的市场价格,目前存在一些不一致的信息:
- 根据部分报道,