CUDA
Chester_Sun
要仰望天空,更要脚踏实地。
展开
-
GPGPU OpenCL/CUDA 高性能编程的10大注意事项
1.展开循环 如果提前知道了循环的次数,可以进行循环展开,这样省去了循环条件的比较次数。但是同时也不能使得kernel代码太大。 循环展开代码例子:转载 2014-04-29 21:51:27 · 503 阅读 · 0 评论 -
初识CUDA
1 grid 和 block都可以用三元向量来表示: grid的数组元素是block block的数组元素是grid但是1.x计算能力的核心,grid的第三元必须为1.block的X和Y索引最大尺寸为5122 通过__launch_bounds__(maxBlockSize,minBlocksPerMp)来限制每个block中最大的线程数,及每个多处理转载 2014-03-25 10:24:08 · 354 阅读 · 0 评论 -
CUDA学习(一)
//分配host内存unsigned int numBytes = N * sizeof(float)float* h_A = (float*) malloc(numBytes);转载 2014-04-27 21:02:24 · 422 阅读 · 0 评论 -
CUDA5.5+Ubuntu12.04安装文档
1. 准备从官网下载Ubuntu 12.04 LTS下载地址:http://www.ubuntu.com/download/desktop(强烈建议使用英文版,因为用中文的话可能会在安装CUDA时出现意想不到的错误)如果你无法访问上面的网址,用这个网址:http://www.ubuntu.org.cn/download/desktop(这个安装界面是中文的,你可以安装完后再转载 2014-08-25 09:47:05 · 380 阅读 · 0 评论