高性能计算卡Tesla K20简介

版权声明:感谢您对博文的关注!校招与社招,有需要内推腾讯的可以QQ(1589276509)or 微信(louislvlv)联系我哈,期待您的加入。 https://blog.csdn.net/K346K346/article/details/47094319

1.简介

Tesla K20是由NVIDIA公司研发,用于服务器高性能计算的一款GPU,是Tesla品牌下的一个产品。

NVIDIA研发的高性能计算产品Tesla K20,基于开普勒(Kepler)架构,核心芯片GK110、拥有71亿个晶体管,而且还有更高端的Tesla K20X兄弟产品、K40、K80等升级产品。

采纳Tesla K20系列的机构还有:美国克莱姆森大学、印第安纳大学、南加州大学(USC)、托马斯·杰斐逊国家加速器实验室、国家超级计算应用中心(NCSA)、国家海洋和大气管理局(NOAA);沙特阿拉伯阿卜杜拉国王科技大学(KAUST);中国上海交通大学等。

NVIDIA旗下三大显卡品牌GeForce和Quadro和Tesla。GeForce定位于游戏影音,Quadro定位于图形设计,Tesla定位于服务器高性能计算。性能要求逐步增强。NVIDIA喜欢用物理学家的名字来为GPU架构命名,所采用的GPU架构主要有:从DX10开始第一代叫做Tesla(特斯拉)、第二代是Fermi(费米)、第三代是Kepler(开普勒)、第四代是Maxwell(麦克斯韦),这些科学家的大名是如雷贯耳,不再作解释。此时,Tesla曾经也是GPU架构的名称,但现在主要指的是显卡品牌。

2.性能参数

引擎规格
架构 开普勒(Kepler)
芯片 GK110
CUDA 处理器核心 2496
核心频率 706 MHz
显存规格
显存大小 5 GB
显存频率 2.6 GHz
显存带宽 208 GB/s
显存位宽 320 bits
显存接口 GDDR5
计算性能
单精度浮点性能 3.52 TFLOPS
双精度浮点性能 1.17 TFLOPS(1/3)
其他
晶体管数量 71亿
制造工艺 28 nm
发行价格 $3199

参考文献

[1]http://www.nvidia.cn/content/PDF/kepler/Tesla-K20-Active-BD-06499-001-v04.pdf

国内首款单机4片Tesla GPU高性能计算工作站

10-10

 rn  在先后推出两代使用HP工作站平台的“[url=http://www.quadro.net.cn/Pro_DocumentReading.aspx?id=1435][color=#0000FF]Tesla个人超级计算工作站解决方案[/color][/url]”和“[url=http://www.quadro.net.cn/Pro_DocumentReading.aspx?id=1500][color=#0000FF]基于Xeon 5500平台的Tesla高性能计算工作站方案[/color][/url]”之后,我们规划了半年多的一款机型终于推出,这就是科卓Quadro 5120-TC IV高性能计算工作站。和以往的产品相比,它的最大特点就是在一台主机上安装了4块NVIDIA Tesla C1060计算处理器(之前的最多只有2块),理论浮点运算能力接近4Tflops(单精度)。rnrnrn  也许有人会问,Tesla S1070不是同样包含4个GPU吗?并且只有1U机架式服务器的大小。不过S1070只包括了GPU及其供电,需要另外连接主机(工作站或者服务器)才能工作;而科卓Quadro 5120-TC IV高性能计算工作站则是一套完整的系统,包含CPU和GPU,能够独立工作。另外上,Tesla S1070由于空间限制使用了小尺寸高转速(最高可达10000rpm以上)的散热风扇,其工作噪音和1U服务器处于同一水平,通常需要放到机房的机柜上,不太适合桌边应用;而科卓Quadro 5120-TC IV的散热经过专门优化设计,它的噪声相对低的多,放在办公室里也不会明显干扰使用者。rnrnrn科卓Quadro 5120-TC IV关键特性rnrnrn• 最多支持4块双插槽宽度GPU计算处理器(NVIDIA Tesla C1060)rnrnrn1. 双路Intel 5500系列Xeon 四核处理器,QPI总线频率最高6.4 GT/srnrnrn2. 最大支持96GB DDR3 1333/1066/800MHz ECC Registered内存rnrnrn3. 4个 (x16) PCI-E 2.0扩展槽rnrn 2个 (x4) PCI-E 2.0扩展槽 (x16物理尺寸)rnrn 1个 (x4) PCI-E扩展槽 (x8物理尺寸)rnrn 2个PCI 33MHz slots rnrnrn4. Intel® 双82574L千兆以太网卡rnrnrn5. 8个3.5" 热插拔驱动器托架 rnrn 最多支持6块SATA硬盘rnrnrn6. 1400W 80plus金牌认证冗余电源 rnrnrn7. 塔式或者4U机架 rnrnrn8. 4块Nvidia Tesla C1060 GPU卡rnrnrnrn  科卓Quadro 5120-TC IV高性能计算工作站可以说是目前所有Xeon 5500平台工作站中扩展性最好的一款。除了4个PCI-E x16 2.0扩展槽能够支持4块NVIDIA Tesla C1060之外,还有2个PCI-E x4 2.0扩展槽(x16物理尺寸)可以用于安装专业显卡(由于带宽和供电的原因,不推荐使用高端专业卡),彻底解决了因为插槽数量而影响GPU性能扩展的问题。当然,对显卡性能要求较高的应用(如:[url=http://www.quadro.net.cn/Pro_DocumentReading.aspx?id=1528][color=#0000FF]NVIDIA OptiX光线追踪引擎[/color][/url])也可以选择1片Quadro FX 5800/4800/3800加上1~3片Tesla的“专业显示+GPU并行计算”的方案。rnrnrn  随着CUDA在高性能计算领域的不断推广,配置多个GPU的计算环境会像现在的CPU SMP(对称多处理器)一样逐渐发展起来,而它在硬件上实现起来比4~多路CPU平台要容易的多。尽管我们还可以通过网络来实现CPU/GPU集群计算(如:中科院过程工程所,参见:“[url=http://www.quadro.net.cn/Pro_DocumentReading.aspx?id=1454][color=#0000FF]复杂多相流动分子动力学模拟在GPU上的实现[/color][/url]”一文),但编程难度相对较大;千兆以太网性能较差而Infiniband互连的成本较高,并且带宽都无法与本机的PCI-E x16 2.0总线相比。因此对于中小规模的CPU+GPU高性能计算来说,科卓Quadro 5120-TC IV高性能计算工作站是一种比较好的解决方案。rnrnrn  Jacket Engine for Matlab是目前CUDA应用在商业软件方面比较成功的案例。Jacket作为Matlab的一个插件(参见:“[url=http://www.quadro.net.cn/Pro_DocumentReading.aspx?id=1483][color=#0000FF]GPU加速Matlab高性能计算-Tesla+Jacket Engine解决方案[/color][/url]”一文),能够利用GPU大幅提升计算的效率。目前Jacket还在不断的改进中,新版本的功能日趋完善([url=http://www.quadro.net.cn/Pro_DocumentReading.aspx?id=1522][color=#0000FF]Jacket v1.1发布-MATLAB GPU插件支持双精度浮点计算[/color][/url])。2009年10月1日,AccelerEyes发布了支持多GPU的v1.2版本([url=http://www.quadro.net.cn/Pro_DocumentReading.aspx?id=1524][color=#0000FF]Jacket v1.2功能预览-支持MATLAB跨多GPU并行计算[/color][/url])。rnrnrnrnrn点击进入相关产品页面rn[url=http://www.quadro.net.cn/Pro_ProductShow.aspx?id=332][color=#0000FF]http://www.quadro.net.cn/Pro_ProductShow.aspx?id=332[/color][/url]rn rn

没有更多推荐了,返回首页

私密
私密原因:
请选择设置私密原因
  • 广告
  • 抄袭
  • 版权
  • 政治
  • 色情
  • 无意义
  • 其他
其他原因:
120
出错啦
系统繁忙,请稍后再试