使用CUDA V6.5环境,显卡为GT630的程序,在另外一台CUDA V5.0,显卡为GT510的环境,需要修改所有V6.5的设置为V5.0。(后续发布需要考虑灵活配置,以便支持不同版本CUDA)
在GT510上,计算出结果全为0,耗时200ms(正常应为秒级);打开项目属性,配置CUDA C/C++/Device/Code Generation为“compute_20,sm_20”(原始为compute_30,sm_30),之后可以计算出正确结果。
以下是耗时比较:
GT630:10500ms;
GT510:35000ms;
GT510 GT630规格比较:
CUDA Cores 48 96
Graphics Clock (MHz) 523 700/810
Processor Clock (MHz) 1046 1400/1620
Texture Fill Rate (billion/sec) 4.2 11.2/13
Memory Clock 最高898 MHz 1.6-1.8/3.2/1.8Gbps
Standard Memory Config 1 GB或2 GB DDR3 1GB
Memory Interface DDR3 DRR 3/GDRR 5
Memory Interface Width 64-bit 128-bit
Memory Bandwidth (GB/sec) 14.4 25.6-28.8/51.2