GK110强势到来!Tesla K20X/K20正式发布

NVIDIA在超级计算大会SC12上发布了基于开普勒架构的Tesla K20X高性能计算卡,该卡拥有2688个流处理器,6GB GDDR5显存,单精度浮点性能达到3.95TFlops。Tesla K20X已用于橡树岭国家实验室的超级计算机泰坦,助力其登上性能榜首。
摘要由CSDN通过智能技术生成

新一届超级计算大会SC12今天开幕了,除了公布新的TOP500超算榜单,各大相关厂商也是一股脑地发布或者宣布了多款高性能计算产品。先来看NVIDIA这边,基于开普勒大核心GK110、拥有71亿个晶体管的Tesla K20终于正式发布了,而且还有更高端的Tesla K20X。

Tesla K20X拥有十四组SMX、2688个流处理器,屏蔽了一组192个,但同时启用完整的384-bit显存位宽和1.5MB二级缓存,搭配6GB GDDR5。频率方面核心定在732MHz,浮点性能为单精度FP32 3.95TFlops、双精度FP64 1.31TFlops(这代3:1上代费米2:1),显存频率则是5.2GHz,带宽达249.6GB/s。

事实上,美国橡树岭国家实验室的新一代超级计算机“泰坦”里配备的就是Tesla K20X,而不是Tesla K20,只不过之前双方都口风甚紧,谁也没有明说。泰坦此番不仅成功登顶超算王者,拿下世界性能第一,还在能效上超越了半年前的绿色超算第一名。

Tesla K20又放弃了一组SMX和一个显存控制器,因此有2496个流处理器、320-bit位宽,显存容量5GB GDDR5,二级缓存也对应地减少到1.25MB。核心频率也略降至706MHz,因此浮点性能减少为单精度3.52TFlops、双精度1.17TFlops,而显存频率仍然是5.2GHz,带宽为208GB/s。

Tesla K20X的热设计功耗为235W,Tesla K20则降低到225W——别小看了这区区10W,225W正是绝大多数服务器和机柜所允许的扩展卡最大TDP,再高就需要定制了,AMD 375W的双芯型FirePro S10000就比较麻烦。二者都提供主动和被动散热,供客户选择。

相比之下,上一代费米架构的Tesla M2090/M2070Q只有30亿个晶体管、最多512个流处理器、384-bit 3.7GHz 6GB GDDR5显存,浮点性能最高单精度1.33TFlops、双精度655GFlops,热设计功耗最高250W。AMD FirePro S10000单精度高达5.91TFlops,双精度也有1.48TFlops,比之Tesla K20X分别高出50%、13%,但到了实际生态里显然还是Tesla更有优势。

Tesla K20的建议零售价为3199美元,Tesla K20X则未公布,估计4000-5000美元范围。二者均已开始大规模出货了,客户包括Appro、华硕、Cray、Eurotech、富士通、惠普、IBM、广达、SGI、Supermicro、T-Platforms、泰安。

除了橡树岭,其它采纳Tesla K20系列的机构还有:美国克莱姆森大学、印第安纳大学、南加州大学(USC)、托马斯·杰斐逊国家加速器实验室、国家超级计算应用中心(NCSA)、国家海洋和大气管理局(NOAA);沙特阿拉伯阿卜杜拉国王科技大学(KAUST);中国上海交大

NVIDIA宣称,Tesla K20X搭配Intel Sandy Bridge处理器,可以将大量高性能计算应用的性能提升十倍乃至更多,包括:

- MATLAB(工程):18.1倍
- Chroma(物理):17.9倍
- SPECFEM3D(地球科学):10.5倍
- AMBER(分子动力学):8.2倍

NVIDIA还表示,Tesla K20X/K20在过去三十天内就累计出货提供了超过30PFlops的浮点性能,相当于过去时间最快超级计算机的总和!

此前发布的双GK104核心的Tesla K10并不会被取代和淘汰,而是将与Tesla K20系列并存。事实上,Tesla K20的单精度浮点性能还更高呢,达到了4.5TFlops,只是没有SRAM ECC、HyperQ、Dynamic Parallelism等高端技术。

GK110强势到来!Tesla K20X/K20正式发布
Tesla K20X高清实物照

GK110强势到来!Tesla K20X/K20正式发布
Tesla K20高清实物照

GK110强势到来!Tesla K20X/K20正式发布
GK110核心架构图(完整的2880个流处理器)

GK110强势到来!Tesla K20X/K20正式发布
GK110 SMX阵列架构图

GK110强势到来!Tesla K20X/K20正式发布
Tesla K20/2000系列规格对比

GK110强势到来!Tesla K20X/K20正式发布
开普勒、费米核心规格对比

GK110强势到来!Tesla K20X/K20正式发布
双精度浮点效率:上代只有65%,现在提高到了惊人的93%,Intel Xeon也才不过86%

GK110强势到来!Tesla K20X/K20正式发布
HyperQ、Dynamic Parallism技术

GK110强势到来!Tesla K20X/K20正式发布
之前说的Tesla K20价格和出货时间,实际上提前了

GK110强势到来!Tesla K20X/K20正式发布
泰坦超级计算机的计算板:四颗十六核心Opteron、四块Tesla K20X(左侧)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值