NVIDIA GPU 架构
NVIDIA GPU 的 SM(Streaming Multiprocessor) 和 GPC(Graphics Processing Cluster) 是 GPU 架构中的关键组成部分。它们决定了 GPU 的计算能力和性能,以下是对这两个参数的详细介绍:
1. GPC(Graphics Processing Cluster)—— 图形处理集群
定义:
GPC 是 GPU 中更高层次的组织单元,负责管理多个 SM 和其它子单元,协调图形渲染、计算任务的调度与执行。
性能意义:
- GPC 的数量直接影响 GPU 的渲染能力,更多的 GPC 允许显卡在更复杂的场景下保持高性能。
- 在最新架构中,GPC 的设计进一步优化以支持更高分辨率、更复杂的几何和光追任务。
架构示意图
一个典型 NVIDIA GPU 的架构层级可以表示为:
GPU
├── GPC (Graphics Processing Cluster)
│ ├── TPC (Texture/Processor Cluster)
│ │ ├── SM (Streaming Multiprocessor)
│ │ │ ├── CUDA 核心 (CUDA Cores)
│ │ │ ├── 张量核心 (Tensor Cores)
│ │ │ ├── RT 核心 (Ray Tracing Cores)
│ │ │ └── 纹理单元 (Texture Units)
│ │ └── PolyMorph Engine
│ └── Raster Engine (光栅引擎)
└── L2 Cache (共享缓存)
- TPC(Texture/Processor Cluster):每个 GPC 包含多个 TPC,每个 TPC 包括两个 SM 单元。
- Raster Engine(光栅引擎):负责光栅化任务,将 3D