记录了NVIDIA_A100_SXM2_40GB加速卡的详细参数
参考链接: https://www.xincanshu.com/gpu/NVIDIA_A100_SXM4_40_GB/canshu.html
主要参数
参数 | 值 | 描述 |
---|
核心频率 | 1095 MHz | 核心 一秒内能够进行多少处理周期 |
Turbo频率 | 1410 MHz | 突发加速频率,类似于CPU睿频 |
流处理单元 | 6912 个 | 负责处理图像不同方面的构造 |
核心架构 | Ampere | 核心架构代号 |
GPU代号 | GA100 | 核心架构代号 |
生产工艺 | 7 nm | 越小的尺寸代表芯片越新。 |
TDP功耗 | 400W | 越低的TDP 通常表示它消耗的电量更少。 |
内存参数
参数 | 值 | 描述 |
---|
内存频率 | 2.4 Gbps | |
内存类型 | HBM2 | |
内存位宽 | 5120 bit | |
最大显存 | 32 GB | |
参数补充
参数 | 值 | 描述 |
---|
代工厂 | TSMC | |
核心面积 | 826 mm² | |
一级缓存 | 1292 KB | |
二级缓存 | 40 MB | |
光栅单元 | 432 | |
纹理单元 | 160 | |
SM count | 108 | |
Tensor cores | 432 | |
建议电源 | 800 W | |
总线接口 | PCIe 4.0 x16 | |
理论性能
参数 | 值 | 描述 |
---|
像素填充率 | 225.6 GPixel/s | |
纹理填充率 | 609.1 GTexel/s | |
显存带宽 | 1555 GB/s | |
FP16 | 77.97 TFLOPS (4:1) | 半精度浮点运算次数 |
FP32 | 19.49 TFLOPS | 单精度浮点运算次数 |
FP64 | 9.746 TFLOPS (1:2) | 双精度浮点运算次数 |
显卡特性
参数 | 值 | 描述 |
---|
DirectX | N/A | |
OpenGL | N/A | |
OpenCL | 3.0 | |
Vulkan | N/A | |
CUDA | 8.0 | |
Shader model | N/A | |