前言
最近读者问我们 如果想自己本地部署Stable Diffusion本地环境, 需要买哪种显卡?有些卡很贵,有什么区别
这个就要涉及到训练卡和推理卡的区别,它们在设计和性能上有着明显的差异,以适应不同的计算需求。
本文来解释各自的优势和应用场景,各自的优势。
硬件指标
事实上,H100/A100 和最大的区别就在通信和内存上,算力差距不大。
H100 |
A100 |
4090 |
|
H100 |
A100 |
4090 |
|
Tensor FP16 算力 |
989 Tflops |
312 Tflops |
330 Tflops |
Tensor FP32 算力 |
495 Tflops |
156 Tflops |
83 Tflops |