型号为H100、H800、A100、A800、4090、4090D、L40s、L40、H20、L20
1、H100的产品参数(中英文彩页参数略有不同)
2、H800的产品参数
对比H100和H800,FP64差距极大,H100为30T,H800为1T,高精度计算基本被阉割掉了。
3、A100的产品参数
4、A800的产品参数
5、RTX 4090的产品参数
6、RTX 4090D的参数和4090对比(彩页或白皮书未找到)
7、L40s的产品参数
8、L40的产品参数(产品彩页未找到)
外形规格 | L40 | L40S |
GPU Architecture | Ada Lovelace | Ada Lovelace |
GPU 显存 | 48GB | 48GB |
GPU 显存带宽 | 864GB/s | 864GB/s |
CUDA Cores | 18176 | 18176 |
RT Cores | 142 | 142 |
RT Cores Performance TFLOPS | 209 | 209 |
Tensor Cores | 568 | 568 |
FP32 TFLOPS | 90.5 | 91.6 |
FP32 Tensor Core TFLOPS | 90.5 | 183 |
BFLOAT16 Tensor Core TFLOPS | 181.05 | 362.05 |
FP16 Tensor Core TFLOPS | 181.05 | 362.05 |
FP8 Tensor Core TFLOPS | 362 | 733 |
Peak INT8 TOPS | 362 | 733 |
Peak INT4 TOPS | 724 | 733 |
显示端口 | 4×DP 1.4a | 4×DP 1.4a |
PCIe Generation | PCIe Gen4×16 | PCIe Gen4×16 |
大热设计功率 (TDP) | 300W | 350W |
9、H20和L20的产品参数