GPU 架构概述
本文主要介绍 NVIDIA GPU 每一代架构的技术发展和架构之间的区别和联系,时间跨度从 2010 年至 2017 年,包括费米(Feimi)、开普勒(Kepler)、麦克斯韦(Maxwell)、帕斯卡(Pashcal)和伏特(Volt)架构。
架构名称 | Fermi | Kepler | Maxwell | Pascal | Volta |
---|---|---|---|---|---|
中文名字 | 费米 | 开普勒 | 麦克斯韦 | 帕斯卡 | 伏特 |
发布时间 | 2010 | 2012 | 2014 | 2016 | 2017 |
核心参数 | 16 个 SM,每个 SM 包含 32 个 CUDA Cores,一共 512 CUDA Cores | 15 个 SMX,每个 SMX 包括 192 个 FP32+64 个 FP64 CUDA Cores | 16 个 SM,每个 SM 包括 4 个处理块,每个处理块包括 32 个 CUDA Cores+8 个 LD/ST Unit + 8 SFU | GP100 有 60 个 SM,每个 SM 包括 64 个 CUDA Cores,32 个 DP Cores | 80 个 SM,每个 SM 包括 32 个 FP64+64 Int32+64 FP32+8 个 Tensor Cores |
特点&优势 | 首个完整 GPU 计算架构,支持与共享存储结合的 Cache 层次 GPU 架构,支持 ECC GPU 架构 | 游戏性能大幅提升,首次支持 GPU Direct 技术 | 每组 SM 单元从 192 个减少到每组 128 个,每个 SMM 单元拥有更多逻辑控制电路 | NVLink 第一代,双向互联带宽 160GB/s,P100 拥有 56 个 SM HBM | NVLink2.0,Tensor Cores 第一代,支持 AI 运算,NVSwitch1.0 |
纳米制程 | 40/28nm 30 亿晶体管 | 28nm 71 亿晶体管 | 28nm 80 亿晶体管 | 16nm 153 亿晶体管 | 12nm 211 亿晶体管 |
代表型号 | Quadro 7000 | K80 K40M | M5000 M4000 GTX 9XX 系列 | P100 P6000 TTX1080 | V100 TiTan V |
现代计算机的内存结构主要如下:
Fermi 架构
2010 年 NVIDIA 提出 Feimi 架构,最大可支持 16 个 SMs,每个 SM 有 32 个 CUDA Cores,一共 512 个 CUDA Cores,架构设计主要是以当