如何理解CUDA中的cudaMalloc()的参数

最新推荐文章于 2025-03-23 17:08:52 发布

aban-mtd

最新推荐文章于 2025-03-23 17:08:52 发布

阅读量4.3w

点赞数 36

分类专栏： CUDA 文章标签： cuda 编程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bendanban/article/details/8151335

版权

CUDA 专栏收录该内容

49 篇文章

订阅专栏

对指针和地址比较熟悉的童鞋可以比较容易的理解这个概念，为了更好的让更多的人理解cudaMalloc的参数，写这篇文章，以飨读者。

首先看下此运行时函数的原型：

cudaError_t cudaMalloc (void **devPtr, size_t  size );

此函数返回值是CUDA中定义的一个错误代码。

主要的第一个参数。为什么是两个星星呢？用个例子来说明下。

float *device_data=NULL;
size_t size = 1024*sizeof(float);
cudaMalloc((void**)&device_data, size);

上面这个例子中我在显存中申请了一个包含1024个单精度浮点数的一维数组。而device_data这个指针是存储在主存上的。之所以取device_data的地址，是为了将cudaMalloc在显存上获得的数组首地址赋值给device_data。在函数中为形参赋值是不会在实参中繁盛变化的，但是指针传递的是地址，我们操作了某个地址的数据，实际上是真的改变了指定地址的数据。像这个申请显存的函数，第一个参数传递的是device_data这个指针的地址，然后改变这个地址的内容就会带给实参真正的改变。

如果大家不明白，留言奥。

2015年3月13号16点42分追加：

“指针”也是一种变量，之所以叫他指针，完全是因为它的值是内存地址。

既然指针是变量，那么变量也是需要存储空间的。

cudaMalloc的第一个参数传递的是存储在cpu内存中的指针变量的地址，cudaMalloc在执行完成后，向这个地址中写入了一个地址值（此地址值是GPU显存里的）。

评论 19

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。