NVIDIA CUDA初级教程视频--(五)

**

第五章GPU编程模型

**
1.CPU和GPU交互:有各自的物理内存空间,通过PCIE总线互连,交互开销较大
2.GPU存储器层次架构:
Work item:理解为ALU,处理核,有私有的存储空间,及其对应的寄存器
Compute unit:SM 会有一段共享存储空间 通带PCIE总线和计算设备进行交互
访存速度:寄存器(有专门硬件支持)、共享存储单元、local memory、global memory(显存的一部分),constant memory(有专门cach管理),Texture memory
3.GPU线程模型:grid:写的程序,代码块,若干个线程组成了一个block
线程组织架构说明:一个kernel具有大量 线程,线程被划分为线程块blocks,kernel启动一个“grid”,包含若干线程块,线程和线程块具有唯一的标识
4.GPU线程映射关系:

线程私有的有寄存器和local memory,线程块都有自己的shared memory,每个设备有对应的global memory
5.编程模型
常规意义的GPU用于处理图形图像
操作于像素,每个像素的操作都类似
可以应用SIMD (single instruction multiple data)
6. Single Instruction Multiple Thread (SIMT) 和SIMD相似
GPU版本的 SIMD,大量线程模型获得高度并行,线程切换获得延迟掩藏,多个线程执行相同指令流,GPU上大量线程承载和调度

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值