GPU 架构概述 费米(Feimi)、开普勒(Kepler)、麦克斯韦(Maxwell)、帕斯卡(Pashcal)和伏特(Volt)架构

GPU 架构概述

本文主要介绍 NVIDIA GPU 每一代架构的技术发展和架构之间的区别和联系,时间跨度从 2010 年至 2017 年,包括费米(Feimi)、开普勒(Kepler)、麦克斯韦(Maxwell)、帕斯卡(Pashcal)和伏特(Volt)架构。

架构名称 Fermi Kepler Maxwell Pascal Volta
中文名字 费米 开普勒 麦克斯韦 帕斯卡 伏特
发布时间 2010 2012 2014 2016 2017
核心参数 16 个 SM,每个 SM 包含 32 个 CUDA Cores,一共 512 CUDA Cores 15 个 SMX,每个 SMX 包括 192 个 FP32+64 个 FP64 CUDA Cores 16 个 SM,每个 SM 包括 4 个处理块,每个处理块包括 32 个 CUDA Cores+8 个 LD/ST Unit + 8 SFU GP100 有 60 个 SM,每个 SM 包括 64 个 CUDA Cores,32 个 DP Cores 80 个 SM,每个 SM 包括 32 个 FP64+64 Int32+64 FP32+8 个 Tensor Cores
特点&优势 首个完整 GPU 计算架构,支持与共享存储结合的 Cache 层次 GPU 架构,支持 ECC GPU 架构 游戏性能大幅提升,首次支持 GPU Direct 技术 每组 SM 单元从 192 个减少到每组 128 个,每个 SMM 单元拥有更多逻辑控制电路 NVLink 第一代,双向互联带宽 160GB/s,P100 拥有 56 个 SM HBM NVLink2.0,Tensor Cores 第一代,支持 AI 运算,NVSwitch1.0
纳米制程 40/28nm 30 亿晶体管 28nm 71 亿晶体管 28nm 80 亿晶体管 16nm 153 亿晶体管 12nm 211 亿晶体管
代表型号 Quadro 7000 K80 K40M M5000 M4000 GTX 9XX 系列 P100 P6000 TTX1080 V100 TiTan V

现代计算机的内存结构主要如下:

Fermi 架构

2010 年 NVIDIA 提出 Feimi 架构,最大可支持 16 个 SMs,每个 SM 有 32 个 CUDA Cores,一共 512 个 CUDA Cores,架构设计主要是以

  • 33
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

EwenWanW

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值