CUDA总共提供两种类型的随机数生成,一种是位于host(CPU)端的随机数,一种是位于device(GPU)端的随机数。
(1) 对于host端的随机数生成,需要#include<curand.h>头文件,还需要curand依赖库。不过host端随机数不一定要在host端生成,也可以指定在device端生成。当指定在host端生成随机数时,程序调用CPU完成所有随机数,并将所有的结果保存在host端;而当指定在device端生成随机数时,程序的调用由CPU完成,程序的执行却是在device端,最终生成的随机数也保存着在device的全局内存中。
(2) 对于device端的随机数生成,则需要#include<curand_kernel.h>。此时随机数生成也是使用GPU生成,由于此时的代码可以直接编写在device或者global函数中,生成的随机数可以直接被核函数调用.
使用curand的deviceAPI生成随机数主要需要三个步骤
a.创建一个随机算法状态的对象,如curandState state。
b.对状态进行初始化,使用curand_init()函数。
c.生成随机数,使用curand,生成unsigned int型整数,没有特殊分布。