CUDA编程模型之内存管理

最新推荐文章于 2024-07-27 12:20:46 发布

djvs16174

最新推荐文章于 2024-07-27 12:20:46 发布

阅读量148

点赞数

文章标签： python 内存管理

原文链接：http://www.cnblogs.com/yuqiujie/p/8884064.html

版权

CUDA编程模型假设系统是由一个主机和一个设备组成的，而且各自拥有独立的内存。

主机：CPU及其内存（主机内存），主机内存中的变量名以h_为前缀,主机代码按照ANSI C标准进行编写

设备：GPU及其内存（设备内存），设备内存中的变量名以d_为前缀，设备代码使用CUDA C标准进行编写

一个典型的CUDA程序实现流程：

1.把数据从CPU内存拷贝到GPU内存

在CPU上申请内存：float *h_A;

h_A=(float*)malloc(nBytes);

在GPU上申请内存：float *d_A;

cudaMalloc((float**)&d_A,nBytes);

数据传输：cudaMemcpy(d_A,h_A,nBytes,cudaMemcpyHostToDevice);

2.调用核函数对存储在GPU内存中的数据进行操作

3.将数据从GPU内存传送回到CPU内存

数据传输：cudaMemcpy(h_C,d_C,nBytes,cudaMemcpyDeviceToHost);
释放GPU内存：cudaFree(d_A);
释放CPU内存：free(h_A);

说明：

1.GPU内存分配：cudaMalloc函数

函数原型：cudaError_t cudaMalloc(void** devPtr, size_t size)

该函数负责向设备分配一定字节的线性内存，并以devPtr的形式返回指向所分配内存的指针。

2.主机和设备之间的数据传输：cudaMemcpy函数

函数原型：cudaError_t cudaMemcpy（void* dst, const void* src, size_t count, cudaMemcpyKind kind）

该函数以同步方式执行，从src指向的源存储区复制一定数量的字节到dst指向的目标存储区。复制方向由kind指定。

kind有四种选择：cudaMemcpyHostToHost、cudaMemcpyHostToDevice、cudaMemcpyDeviceToHost、cudaMemcpyDeviceToDevice

如果GPU内存分配成功，函数返回cudaSuccess;否则返回cudaErrorMemoryAllocation

可以使用CUDA运行时函数将错误代码转化为可读的错误信息：char* cudaGetErrorString(cudaError_t error)

3.释放GPU内存:cudaFree函数

函数原型：cudaError_t cudaFree(void* devPtr）

转载于:https://www.cnblogs.com/yuqiujie/p/8884064.html

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CUDA编程模型之内存管理

CUDA编程模型假设系统是由一个主机和一个设备组成的，而且各自拥有独立的内存。主机：CPU及其内存（主机内存），主机内存中的变量名以h_为前缀,主机代码按照ANSI C标准进行编写设备：GPU及其内存（设备内存），设备内存中的变量名以d_为前缀，设备代码使用CUDA C标准进行编写一个典型的CUDA程序实现流程：1.把数据从CPU内存拷贝到GPU内存在CP...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。