模型优化部署CUDA基础篇:第一个CUDA代码-打印hello-world

功能:使用gpu打印helloworld

#include <stdio.h>  // 调用printf等函数 gpu端不支持iostream这个库,所以只能用stdio.h

// __global__定义一个全局函数,在 GPU 上执行
__global__ void hello_world(void)
{
    printf("This is GPU\n");  // GPU 上执行的打印语句
}

// 主函数运行在 CPU 上
int main()
{
    printf("This is CPU\n");  // CPU 上执行的打印语句

    // 调用 GPU 内核,配置为1个block,每个block包含1个threads
    hello_world<<<1,1>>>();

    // 调用 cudaDeviceSynchronize 等待 GPU 完成所有任务,确保所有的 GPU 输出完成再往下运行
    // 因为有可能出现cpu这边已经运行结束了 gpu还没运行完
    cudaDeviceSynchronize();  

    // 重置CUDA设备,清理所有GPU资源,例如关闭 GPU 上的所有线程
    cudaError_t error = cudaDeviceReset();

    // 检查 cudaDeviceReset 是否成功执行
    if (error != cudaSuccess) {
        fprintf(stderr, "CUDA error: %s\n", cudaGetErrorString(error));  // 如果有错误,打印错误信息
        return 1;  // 返回 1 表示程序异常退出
    }

    return 0;  // 正常退出程序
}

可以直接使用nvcc去编译CUDA代码

但是最好使用cmake,因为cmake在项目复杂的时候更加方便

cmake是学习cuda的基础

cmake代码:

cmake_minimum_required(VERSION 3.18)
project(hello CUDA)

# 设置策略以允许自动检测,或者可以删除这行并指定具体的架构
cmake_policy(SET CMP0104 OLD)

# 添加可执行文件
add_executable(hello a1.cu)
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值