功能:使用gpu打印helloworld
#include <stdio.h> // 调用printf等函数 gpu端不支持iostream这个库,所以只能用stdio.h
// __global__定义一个全局函数,在 GPU 上执行
__global__ void hello_world(void)
{
printf("This is GPU\n"); // GPU 上执行的打印语句
}
// 主函数运行在 CPU 上
int main()
{
printf("This is CPU\n"); // CPU 上执行的打印语句
// 调用 GPU 内核,配置为1个block,每个block包含1个threads
hello_world<<<1,1>>>();
// 调用 cudaDeviceSynchronize 等待 GPU 完成所有任务,确保所有的 GPU 输出完成再往下运行
// 因为有可能出现cpu这边已经运行结束了 gpu还没运行完
cudaDeviceSynchronize();
// 重置CUDA设备,清理所有GPU资源,例如关闭 GPU 上的所有线程
cudaError_t error = cudaDeviceReset();
// 检查 cudaDeviceReset 是否成功执行
if (error != cudaSuccess) {
fprintf(stderr, "CUDA error: %s\n", cudaGetErrorString(error)); // 如果有错误,打印错误信息
return 1; // 返回 1 表示程序异常退出
}
return 0; // 正常退出程序
}
可以直接使用nvcc去编译CUDA代码
但是最好使用cmake,因为cmake在项目复杂的时候更加方便
cmake是学习cuda的基础
cmake代码:
cmake_minimum_required(VERSION 3.18)
project(hello CUDA)
# 设置策略以允许自动检测,或者可以删除这行并指定具体的架构
cmake_policy(SET CMP0104 OLD)
# 添加可执行文件
add_executable(hello a1.cu)