如何理解 CUDA 中的 cudaMalloc() 的参数

运行时函数的原型:
  1. cudaError_t cudaMalloc (void **devPtr, size_t  size );   
此函数返回值是 CUDA 中定义的一个错误代码。

主要是第一个参数。为什么是两个星星呢?用个例子来说明下。

  1. float *device_data=NULL;  
  2. size_t size = 1024*sizeof(float);  
  3. cudaMalloc((void**)&device_data, size);  
上面这个例子中我在显存中申请了一个包含 1024 个单精度浮点数的一维数组。而 device_data 这个指针是存储在主存上的。之所以取 device_data 的地址,是为了将 cudaMalloc 在显存上获得的数组首地址赋值给 device_data。在函数中为形参赋值是不会在实参中发生变化的,但是指针传递的是地址,我们操作了某个地址的数据,实际上是真的改变了指定地址的数据。像这个申请显存的函数,第一个参数传递的是 device_data 这个指针的地址,然后改变这个地址的内容就会带给实参真正的改变。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值