CUDA C程序中最重要的部分就是核函数(kernel)的编写和调用。在此,我们以HelloWorld程序为例,分别讲述kernel函数的编写和调用。
1、kernel函数的编写:
__global__ void kernel_hello(void)
{
printf("Hello Wrld from GPU ! \n");
}
修饰符__global__表示该函数从CPU端调用,然后从GPU端执行。
2、kernel函数的调用:
kernel_hello<<<1,10>>>():
<<<,>>>表示从主线程到设备端代码的调用。一个内核函数通过一组线程来执行,所有线程执行相同的代码。三重尖括号里面的参数是执行配置,用来说明使用多少个线程来执行内核函数。