1.检查环境
which nvcc
输出
2.编写代码
#include<stdio.h>
__global__ void helloDevice(void){
printf("hello cuda_GPU\n"); //global关键字 host调用 device执行
}
int main(void){
printf("hello cuda_host!\n");
helloDevice <<<2,2>>>(); //用两个块,两个线程。
cudaDeviceReset();
}
3.编译
nvcc hello.cu -o hello
4.输出
这里是两个块,两个线程,所以打印4次。