CUDA学习（一）

最新推荐文章于 2022-01-23 22:28:25 发布

Chester_Sun

最新推荐文章于 2022-01-23 22:28:25 发布

阅读量422

点赞数

分类专栏： CUDA

CUDA 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

/ /分配主机内存

unsigned int类型的numBytes = N *的sizeof（浮动）
浮动* h_A =（浮动*）malloc的（以numBytes）;

/ /分配设备内存

浮动* D_A = 0;
cudaMalloc（（无效**）＆D_A，以numBytes）;

/ /复制从主机到设备的数据
对cudaMemcpy（D_A h_a，数组的numBytes，cudaMemcpyHostToDevice）;

/ /执行内核
Increment_gpu <<<Ñ/块大小，块大小>>>（D_A，B）;
/ /复制从设备返回到主机的数据
对cudaMemcpy（h_a，数组D_A，以numBytes，cudaMemcpyDeviceToHost）;
/ /释放设备内存
cudaFree（ D_A）;

	执行的：	只调用从：
__device__浮动DeviceFunc（）	设备	设备
__global__无效KernelFunc（）	设备	主持人
__host__浮动HostFunc（）	主持人	主持人

1， __global__定义了一个内核函数
--->必须返回void
2， __device__和__ host__可以一起使用
3， __device__函数不能取其地址
4，对于设备上执行的功能：
没有递归（递归）
在函数内部没有静态变量声明
无可变数目的参数

	记忆	范围	一生
__shared__诠释SharedVar;	共享	线程块	线程块
__device__诠释GlobalVar;	全球	格	应用
__constant__诠释ConstantVar;	不变	格	应用

1，没有任何修饰词的自动变量存于寄存器中
除驻留在本地内存中大型结构或数组
2，指针可以指向分配或声明的任何全局存储器
或共享内存：
2.1Global内存：
内存分配在主机和传递给内核：
获得作为一个全局变量的地址
2.2Shared记忆：在通话过程中静态分配

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。