CUDA学习笔记 02 函数三种前缀device、global、host

最新推荐文章于 2024-08-08 17:37:04 发布

JackZhangNJU

最新推荐文章于 2024-08-08 17:37:04 发布

阅读量3.5k

点赞数 1

分类专栏： CUDA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/JackZhang_123/article/details/78020238

版权

CUDA 专栏收录该内容

12 篇文章 4 订阅

订阅专栏

CUDA三种前缀分别用于在定义函数时限定该函数的调用和执行方式，如下：

（1）_host_ int foo(int a){}与C或者C++中的foo(int a){}相同，是由CPU调用，由CPU执行的函数。

和我们平常写的函数是一致的。

__host__ int foo(int a)
{
    return 1；
}

（2）_global_ int foo(int a){}表示一个内核函数，是一组由GPU执行的并行计算任务，以foo<<>>(a)的形式或者driver API的形式调用。目前global函数必须由CPU调用，并将并行计算任务发射到GPU的任务调用单元。随着GPU可编程能力的进一步提高，未来可能可以由GPU调用。

执行多线程的global函数好像是比可以返回值的，返回值类型应该是void

__global__ int foo(int a)
{

}

（3）_device_ int foo(int a){}则表示一个由GPU中一个线程调用的函数。由于Tesla架构的GPU允许线程调用函数，因此实际上是将device 函数以__inline形式展开后直接编译到二进制代码中实现的，并不是真正的函数。

__device__ int foo(int a)
{
    return 1；
}

具体来说，device前缀定义的函数只能在GPU上执行，所以device修饰的函数里面不能调用一般常见的函数；global前缀，CUDA允许能够在CPU，GPU两个设备上运行，但是也不能运行CPU里常见的函数；host前缀修饰的事普通函数，默认缺省，可以调用普通函数。

因此，在出现报错如：“error : calling a host function from a global function is not allowed. ”时候，即为将一个普通的函数错误地添加进入了global前缀定义函数，在CUDA文件.cu文件中是不允许的。

host调用host，global调用global和device调用device函数是可以的；

host函数可以调用global函数，反之不可以。

global调用device函数是可以叠，反正应该可以。

同时device函数所在的文件应该是.cu后缀的文件，否者也会出现bug

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。