cuda 线程调度

硬件描述从硬件上看,一块显卡的最小单元是GPU核(或者叫做Stream Processor),所有核心平均分配在多个SM中,而多个SM共同构成整块显卡的核心。比如RTX2070有36个Streaming Multiprocessors,而每个SM有64个CUDA Cores,RTX2070具有36*64=2304个CUDA Cores。软件描述thread,block,grid,war...
摘要由CSDN通过智能技术生成

硬件描述

从硬件上看,一块显卡的最小单元是GPU核(或者叫做Stream Processor),所有核心平均分配在多个SM中,而多个SM共同构成整块显卡的核心。比如RTX2070有36个Streaming Multiprocessors,而每个SM有64个CUDA Cores,RTX2070具有36*64=2304个CUDA Cores。

软件描述

  • thread,block,grid,warp都是CUDA编程上的逻辑概念,编写代码时以便组织线程。
  • thread:线程,最小的运行单元,一个CUDA程序会被很多的线程执行
  • block:线程块,多个thread 组成线程块,一个线程块的所有线程只会分配到同一个SM中运行,同一个块的线程可以同步,也可以通过shared memory通信,并且代价比较小。
  • grid:网格,多个线程块组成网格,一个网格中的线程块任务分配在不同的SM中运行,同一个网格中的线程不能同步。不同线程块之间的线程通信代价很高,尽量不要有这种操作。
  • warp:线程束,一个线程束中的线程属于同一个线程块,GPU线程调度的基本单位,即GPU每次以warp数量的线程为单位进行调度。

线程调度 

 GPU具有成千上万的CUDA Core,同时也会有成千上万个线程需要执行。当一个kernel启动后,线程按

  • 4
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值