文章目录 HelloWorld关于Kernel函数 首先你得有一个CUDA编程环境,此处略,简单点就nvidia-docker走起 HelloWorld #include <stdio.h> void c_hello(){ printf("Hello World from CPU!\n"); } __global__ void cuda_hello(){ printf("Hello World from GPU!\n"); } int main(){ c_hello(); cuda_hello <<<1,10>>>(); cudaDeviceReset(); return 0; } 使用nvcc进行编译,如,nvcc hello.cu 关于Kernel函数 首先,在HelloWorld中核心函数cuda_hello被限定词__global__ 修饰,这是必须的<<<1,1>>>的作用,第一个参数可以看成线程块的个数,第二个可以看成每一个线程块中线程的个数 所有线程块构成一个网格,线程块的个数也可以认为是网格大小<<<网格大小,线程块大小>>> cudaDeviceReset()重置当前线程所关联过的当前设备的所有资源,如在调用cuda的过程中出现中途错误,需要提前退出程序,可以调用这个cudaDeviceReset来清空之前所关联过得所有资源。cudaDeviceSynchronize()同步主机与设备