以下为GPU的内部结构图,图片来自于1 GPU由多个GPU处理集群(GPC)构成,每个GPC由纹理处理集群(TPC)构成,每个TPC由多个流多处理(SM)构成. GPU的最基本的处理单元位于SM中。 SM的结构如下: 英文架构图2 一个SM中可以并行多个线程。通过线程束调度器进行软件层面控制,通过分配单元将线程分配到具体的计算单元中。 计算单元分为int、FP32、FP64以及Tensor Core。 对应的功能结构如下: 详细的内容可以查看视频3 参考链接 V100GPU架构 ↩︎ volta-architecture-whitepaper ↩︎ # GPU硬件架构与CUDA如何对应 ↩︎