CUDA C

CUDA C关键字

__global__:定义函数为设备(device)函数,在显卡上执行并且只能由主机(host)调用;

__device__:定义函数为设备函数,在显卡上执行并且只能由设备函数调用;

__host__:定义函数为主机函数,在主机上执行并且只能由主机函数调用;

注:函数默认定义为主机函数;定义函数时,__device____host__可同时使用,此时函数生成两个复本,一个在显卡上执行,另一个在主机上执行。

CUDA API

cudaMalloc:与Malloc相似,用于动态显存分配,语法:

cudaMalloc(void **devPtr, size_t size);

cudaMemcpy:与Memcpy相似,将一块内存中的值复制到主机内存或显存中,语法:

cudaMemcpy(void *dst, const void *src, size_t count, cudaMemcpyKind kind);

指针dstsrc指向主机或显卡内存地址;kind表示复制类型,包括主机到设备、主机到主机、设备到主机、设备到设备。

注意:kind要与dstsrc一致。

cudaFree:与free相似,用于显存释放,语法:

cudaFree(void **devPtr);

cudaDeviceSynchronize:核调用(kernel launch)采用异步方式,cudaDeviceSynchronize()阻塞

语法:

cudaDeviceSynchronize(void);

cudaGetDeviceCount

语法:

cudaGetDeviceCount(int *count);
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值