CUDA中Unified Memory函数cudaMallocManaged的使用

最新推荐文章于 2024-01-15 20:40:43 发布

xslwyz

最新推荐文章于 2024-01-15 20:40:43 发布

阅读量4.3k

点赞数 3

分类专栏： cuda 文章标签： cuda

本文链接：https://blog.csdn.net/weixin_40294176/article/details/121280157

版权

Unified Memory是啥参见其他博主文章，主要就是简化代码，不需要各种cudamalloc和cudamemcpy。

cuda_runtime_api.h中的接口：extern host cudart_builtin cudaError_t CUDARTAPI cudaMallocManaged(void **devPtr, size_t size, unsigned int flags __dv(cudaMemAttachGlobal));
一般传前两个参数即可。

传指针时先在C代码中malloc，然后cudaMallocManaged()，再赋值，否则cudaMallocManaged()会将值重置为0，结构体内指针重置为00000000。

如果代码不能正常运行，将中文注释删掉。

简单数据类型指针：

int *a = nullptr;
a = (int*)malloc(sizeof(int));
*a = 222;
printf("%d\n", *a);//打印是222
...调用cuda函数//无法调用，会报错退出
cudaMallocManaged((void**)&a, sizeof(int));
cudaDeviceSynchronize();
printf("%d\n", *a);//打印是0
...调用cuda函数//cuda中打印也是0
*a = 222;
printf("%d\n"

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

xslwyz

关注关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
CUDA中Unified Memory函数cudaMallocManaged的使用

Unified Memory是啥参见其他博主文章，主要就是简化代码，不需要各种cudamalloc和cudamemcpy。cuda_runtime_api.h中的接口：extern host cudart_builtin cudaError_t CUDARTAPI cudaMallocManaged(void **devPtr, size_t size, unsigned int flags __dv(cudaMemAttachGlobal));一般传前两个参数即可。传指针时先在C代码中malloc，
复制链接

扫一扫