CUDA Toolkit 3.2新特性

Nvidia发布了最新的CUDA Toolkit 3.2,相对于之前的版本有了很大的性能提升,引入了新的数学函数库以及高端的计算机集群管理等特性,这些特性对于开发者开发下一代GPU加速应用的有很大帮助。

  CUDA Toolkit包括很多工具,函数库以及相关文档,从而帮助开发者编译CUDA C和C++的应用程序,同时CUDA Toolkit还可以作为很多其他GPU通用计算方案的基础。下面列出了CUDA Toolkit 3.2所带来的一些新的特性以及性能提升:

  1. CUDA BLAS(CUBLAS)函数库的性能提升高达300%,相对于Intel最新的MKL计算速度快了8倍左右。

  2. 优化后的CUDA FFT (CUFFT)相对于最新的MKL加速比达到了2-20倍。

  3. 新的CURAND函数库,生成随机数的速度相对于MKL快10-20倍。

  4. 新的稀疏矩阵CUSPARSE函数库的解决方案相对于最新的MKL达到了6-30倍的加速比。

  5. 一些关于GPU调试以及性能分析方面的改进。

  另外,最新发布的CUDA Toolkit 3.2包含了H.264编解码,新的Tesla计算集群的集成,集群的管理等特性,并且支持显存高达6GB的Nvidia Tesla和Quadro系列的GPU产品。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值