理解cudaMalloc()的参数

首先看下此运行时函数的原型:

[cpp]  view plain copy
  1. cudaError_t cudaMalloc (void **devPtr, size_t  size );   
此函数返回值是CUDA中定义的一个错误代码。


主要的第一个参数。为什么是两个*呢?用个例子来说明下。

[cpp]  view plain copy
  1. float *device_data=NULL;  
  2. size_t size = 1024*sizeof(float);  
  3. cudaMalloc((void**)&device_data, size);  

上面这个例子,在显存中申请了一个包含1024个单精度浮点数的一维数组。而device_data这个指针是存储在主存上的。之所以取device_data的地址,是为了将cudaMalloc在显存上获得的数组首地址赋值给device_data。

在函数中为形参赋值是不会在实参中发生变化的,但是指针传递的是地址,我们操作了某个地址的数据,实际上是真的改变了指定地址的数据。像这个申请显存的函数,第一个参数传递的是device_data这个指针的地址,然后改变这个地址的内容就会带给实参真正的改变。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值