“在现代 3D 渲染中,GPU 的性能瓶颈通常是内存带宽,而不是计算能力。” —— NVIDIA Ampere Architecture Whitepaper
换句话说, 随着 GPU 计算性能的快速增长,内存带宽的增长速度滞后,导致内存带宽成为现代 GPU 的主要性能瓶颈。
接下来看一组数据对比:
内存带宽 VS 计算能力:
GPU 架构 | 计算能力(TFLOPS) | 内存带宽(GB/s) | 计算/带宽增长比 |
---|---|---|---|
NVIDIA Kepler | 4.5 | 288 | 16x |
NVIDIA Pascal | 11 | 484 | 22x |
NVIDIA Ampere | 30 | 768 | 39x |
从表中可以看出,GPU 的计算性能提升速度远快于内存带宽的增长速度。
然后回过头再理解开头那句话就明了了, 在 现代GPU