cuda-GPU 加速

最新推荐文章于 2024-06-26 10:00:00 发布

sdzzlove

最新推荐文章于 2024-06-26 10:00:00 发布

阅读量645

点赞数

文章标签： cuda

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sdzzlove/article/details/120506707

版权

__global__ ：主机调用，声明设备函数，在设备上（gpu）执行

__device__ ：设备上执行并从设备上调用

__host__:其他主机调用的主机函数

cudaMalloc，设备上分配内存

cudaMemcpy。别存复制到主机或设备上

cudaFree,释放内存

cudaGetLastError(); 可以获取启动gpu内核错误

cudaDeviceSynchronize（），等待所有核完成工作，返回任何中间的错误，注意这里很重要的一点是这里会等待device完成操作，因为启动内核等操作是异步操作，执行完内核启动后主动权交给cpu，不加这句话，控制台程序会直接结束，看不到异步处理结果。

cudaThreadSynchronize(); 这里也是等待线程结束

cudaStreamSynchronize()和上面的两个函数类似，这个函数带有一个参数，cuda流ID，它只阻塞那些cuda流ID等于参数中指定ID的那些cuda例程，对于那些流ID不等的例程，还是异步执行的。

cudaGetDeviceCount（&devicecount）表示获取所有device数量

cudaSetDevice(index) 表示选择device

cudaError_t cudaStatus; cuda的错误类型

cudaDeviceProp device_Property; 这里可以看到很多device属性信息，例如显存频率等等

利用：cudaGetDeviceProperties(&device_Property, idindex);

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。