模型优化部署CUDA基础篇：第一个CUDA代码-打印hello-world

最新推荐文章于 2024-07-22 21:49:24 发布

灰蒙蒙的天上

最新推荐文章于 2024-07-22 21:49:24 发布

阅读量71

点赞数 1

文章标签： linux 运维服务器

本文链接：https://blog.csdn.net/qq52144324/article/details/139119791

版权

功能：使用gpu打印helloworld

#include <stdio.h>  // 调用printf等函数 gpu端不支持iostream这个库，所以只能用stdio.h

// __global__定义一个全局函数，在 GPU 上执行
__global__ void hello_world(void)
{
    printf("This is GPU\n");  // GPU 上执行的打印语句
}

// 主函数运行在 CPU 上
int main()
{
    printf("This is CPU\n");  // CPU 上执行的打印语句

    // 调用 GPU 内核，配置为1个block，每个block包含1个threads
    hello_world<<<1,1>>>();

    // 调用 cudaDeviceSynchronize 等待 GPU 完成所有任务，确保所有的 GPU 输出完成再往下运行
    // 因为有可能出现cpu这边已经运行结束了 gpu还没运行完
    cudaDeviceSynchronize();  

    // 重置CUDA设备，清理所有GPU资源，例如关闭 GPU 上的所有线程
    cudaError_t error = cudaDeviceReset();

    // 检查 cudaDeviceReset 是否成功执行
    if (error != cudaSuccess) {
        fprintf(stderr, "CUDA error: %s\n", cudaGetErrorString(error));  // 如果有错误，打印错误信息
        return 1;  // 返回 1 表示程序异常退出
    }

    return 0;  // 正常退出程序
}

可以直接使用nvcc去编译CUDA代码

但是最好使用cmake，因为cmake在项目复杂的时候更加方便

cmake是学习cuda的基础

cmake代码：

cmake_minimum_required(VERSION 3.18)
project(hello CUDA)

# 设置策略以允许自动检测，或者可以删除这行并指定具体的架构
cmake_policy(SET CMP0104 OLD)

# 添加可执行文件
add_executable(hello a1.cu)

灰蒙蒙的天上

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
模型优化部署CUDA基础篇：第一个CUDA代码-打印hello-world

但是最好使用cmake，因为cmake在项目复杂的时候更加方便。功能：使用gpu打印helloworld。可以直接使用nvcc去编译CUDA代码。cmake是学习cuda的基础。
复制链接

扫一扫