位宽512bit显卡_6144 CUDA/512bit位宽 Maxwell架构曝光-CSDN博客

本文链接：https://blog.csdn.net/weixin_30624767/article/details/112012579

NVIDIA下一代Maxwell架构显卡GM100预计将拥有6144个CUDA核心和512bit位宽的显存，最高可达8GB显存容量。Maxwell架构会增强SMX单元设计，优化双精度逻辑单元，同时针对游戏和计算市场推出不同定位的产品。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

【IT168 资讯】NVIDIA目前一代的显卡有GK104和GK110两大分支，它们的侧重点不同，但都是基于Kepler(开普勒，天文学家)架构的，下一代架构名为Maxwell(麦克斯韦尔，物理学家)，根据之前的传闻Maxwell最快将在明年Q1季度问世，制程有可能继续使用TSMC的28nm工艺。现在网上又流传开Maxwell的架构设计了，旗舰GM100将有6144个CUDA核心，512bit位宽显存，显存容量达到了更夸张的8GB。

据WCCFTech报道，Maxwell架构也会同时推向游戏及计算两大市场，NVIDIA计划推出四款Maxwell架构GPU芯片——GM100、GM104、GM106和GM108。与Kepler架构相比，Maxwell将进一步增强SMX单元设计，优化双精度逻辑单元。

▲Maxwell线路图

介绍Maxwell之前最好了解一下Kepler架构，相关介绍可以参阅之前的文章：3倍性能从哪里来，GK110的SMX单元升级3.5代。目前Kepler架构中每组SMX单元有192个CUDA核心，Maxwell的SMX单元将进一步提升CUDA核心数到256个，不过DP双精度浮点单元的比例会从目前的1：3降低到1：4，算起来DP单元总数是保持不变的。256个CUDA核心的SMX单元将大幅增加Maxwell的CUDA总数，而DP双精度单元不用时是可以关闭的，这样也能降低能耗。

纹理单元方面，每组SMX单元会继续维持16个TMU单元，跟Kepler是一样的。

Maxwell的缓存设计也会进一步增强，每组SMX单元会额外增加2个寄存器，大量寄存器线程现在也可以并行运行了。L1缓存从Kepler架构的64kb增加到了128kb，而且可以作为共享内存使用，并且可以32/96、64/64、96/32的比例分配成缓存、共享内存。

L1缓存之外，每个GPC单元还会独享768kb L2缓存作为指令缓存。

具体的四款Maxwell芯片的详细架构如下所示：

GM110核心

目前的GK104核心有4组GPC单元，GK110是5组GPC单元，而GM110拥有8组GPC单元，每个GPC单元有三组SMX单元，每组SMX单元又有256个CUDA核心，这样总计有6144个CUDA核心，384个纹理单元，8MB L3缓存，64个ROP单元，512bit显存位宽，显存容量则达到夸张的8GB。

GM100无疑将取代GK110的旗舰地位，同时用于Tesla和GeForce高端产品线，不过这两个市场的GM100核心也有所不同：GeForce领域中的GM110核心频率在930MHz左右，加速频率1GHz左右，而Tesla中的GM110核心频率约为850MHz，双精度浮点性能达到了2.61TFLOPS。(作为对比的是GTX Titan目前的单精度性能是4.5FLOPS，双精度是1.3TFLOPS)

GM104核心

GM104核心将取代目前的GK104核心，后者的代表产品是GTX 680和GTX 770。

GM104的GPC单元数量降低到5组，拥有3840个CUDA核心，240个TMU纹理单元，40个ROP光栅单元，显存位宽降低到320bit，显存容量3GB，也可能是跟Fermi一样的2.5GB，不过显存位宽降低也使得频率可以更高，显存频率在7GHz左右，核心频率1GHz左右。

GM106核心

GM106核心将取代目前249美元以内的GK106核心的显卡，比如GTX 660、GTX 650 Ti、GTX 650 Ti Boost等。

不过GM106相对来说提升也是非常大的，CUDA核心将从目前的960个暴增到2304个，4MB L3缓存，144个纹理单元，24个ROP单元，显存位宽192bit，容量3GB，频率也能达到7GHz。

GM108核心

GM108之前其实还有GM107核心，目前后者的架构未知，不过驱动信息中已经有GM107存在的暗示了。

目前的ES样品显示GM108有576个CUDA核心，48个纹理单元，8个ROP单元，64bit显存位宽，核心面积跟GF117差不多。

丹佛计划将从Maxwell升级版时代开始?

在NVIDIA最神秘的计划中，Preject Denver丹佛计划最为引人注目，因为它将整合NVIDIA的GPU和ARM的CPU，有关这个处理器的进度一直没有明确消息。最新泄露的消息显示NIVIDIA在Maxwell升级版阶(GM11x)段推出丹佛计划，因为NVIDIA一直在等新的FinFET工艺成熟。这个说法跟NVIDIA在之前的GTC 2013大会上公布的进度有些相符。

▲丹佛处理器

丹佛处理器将整合64位ARM CPU核心，其中只有GM110会搭配8核丹佛处理器，GM110实际上应该被成为GM110 SoC处理器，已经不是单一的GPU或者CPU了。消费级的GM110将有4个CPU核心，整合的GPU则是GM114。整合GM116图形核心的丹佛则只会搭配2个CPU核心。泄露的报告没提到GM118核心整合什么丹佛核心，因此它很可能并不会使用新的架构。

丹佛处理器将有一致性总线(coherent link )用于连接CPU和GPU核心，并会在二者之间分配不同负载。爆料者称NVIDIA认为丹佛计划及相应的驱动优化会使他们的显卡比AMD为GCN架构优化的私有Mantle API更强。

目前最重要但是还不能确认的就是这些芯片是否能在2014年上半年发布，因为TSMC预计在2014年2月份才能量产20nm工艺，而且AMD预计在未来两个季度内使用14nm FinFET工艺流片新处理器，不过真正发布要等到2014年底甚至2015年初。这意味着2014年上半年最可能发布的还是他们的移动芯片，AMD是Crystal系列，NVIDIA是GTX 800M系列，而桌面版有可能到2014年下半年才能发布了。

▲Volta架构

2016年，NVIDIA会进入Vlota架构时代，根据之前在GTC 2013大会上公布的官方消息，Volta架构的带宽可达1TB/s。