Cuda 内存模型相关相关知识

CUDA中, 每个线程所能掌控的内存有如下几种:

      (1)R / W per thread registers。

      (2) R/W per thread local memory(每个线程的局部内存)

        (3)  R/W per block shared memory(共享内存)

        (4) R/W per grid global memory

         (5)  只能线程用于读, 不能用于写的per grid constant memory

         (6) 只能用线程于读, 不能用于写的texture memory.

另外host掌控这global memory. const memory, texture memory。 能够对这三个内存区域进行读和写

为了清楚的表达CUDA的内存模型, 见如下图:



注意, global memory 是host和device进行数据读写通信的主要手段。  global区域中的数据对于所有的thread都是可见的。 

texture 和constant memory 中, constant 区域是被host进行初始化的。  而且这两个内存区域的内容也是被所有的线程可见。

另外, global, constant, 以及texture的memory区域 是数据读写是延迟较大的区域。 

CUDA 有一个API, 即cudaMalloc()函数,  是device的在global memory中分配内存对象所需的内存。 并且使用cudaFree()释放

该global memory中给定的对象。 

cudaMemcpy() 函数是内存中数据的移动用的。 传递的方时有如下几种:

HostToHost

HostToDevice

DeviceToDevice

DeviceToDevice


       

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值