CUDA学习--3

参考《并行计算与实现技术》,初学过程毕竟不易,且行且珍惜!

1、每个网格内的多个线程块需要分配到不同的流多处理器SM上分别调度运行;

     同一个SM上可以有多个活动的线程块轮转执行,但是同一时刻只能有一个线程块运行。

2、线程块内的各个线程需要以线程束为单位分配到每个流处理器SP上调度运行;

     同一个SP上可以有多个活动的线程束轮转执行,但是同一时刻只能有一个线程束运行。

3、以G80系列GPU为例,调度器以线程块为单位将线程分配到SM上,每个SM上最多同时有8个活动的线程块,最后可以有768个活动的线程。

(1)当线程块大小为256时,即一个线程块有256个线程时,SM上最多有3个线程块;

(2)当..................为128时,最多有6个线程块;

(3)当...................为64时,只能有8个。

4、内核调度过程中的线程声明周期:


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值