论NVIDIA下一代GPU中的ECC内存应用情况

论NVIDIA下一代GPU中的ECC内存应用情况
作者: David Kanter 关键字: NVIDIA GPU ECC 内存  

  GPU计算的潮流

  图形显示之外的用于图形计算的GPU市场正在不断增长着,而Nvidia公司的企业战略已经紧紧依赖于这个新兴市场。具体来说,Nvidia正努力把CUDA推向高性能计算(HPC)市场——也就是把图形处理器的强大计算能力和内存带宽,直接转化为计算性能。Nvidia的Tesla产品(为计算而不是显示设计的GPU)已经做了一些宣传推广,但目前其用途还极为有限。至少部分是因为错误检测和纠正(error detection and correction)机制的缺少,GPU集群基本上还不存在。但是我们相信Nvidia的下一个产品版本将会改变这一情况。

  HPC对ECC的纠错机制的需要

  特别对于HPC世界中典型的重计算负荷的机器——集群服务器来说,ECC已经是基本配置了。所有服务器已经在ECC内存和可靠性、可用性、可维护性(RAS)方面建立了标准(例如ECC缓存功能)。通常,这些RAS特性只是Itanium、PowerPC、SPARC、zArch等专用微处理器家族所特有的,而对作为产业标准的x86服务器在这方面往往落后了一点。没有ECC,建立可靠的集群机简直是不可能事情,因为在DRAM内存里的软错误率太高了——而这一点客户都很清楚。

  此外,工艺的改进和半导体设备的按比例缩小趋势导致SRAM、DRAM错误的出现更为普遍。增加密度,提高信号传输率,降低电压,并减少出现单个bit突然成倍增加软错误(SER)风险的情况(这种情况会导致内存数据异常)。不幸的是,半导体的发展都是一些相同的变化——随着时间的推移,价格
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值