数量线程SM,SP和GRID,BLOCK,THREAD之间的对应关系是什么?

最近应用开发的过程中出现了一个小问题,顺便记录一下原因和方法--数量线程

    SM,SP是硬件构结

    

    GRID,BLOCK,THREAD是软件念概

    

    

    

    从硬件度角讲,一个GPU由多个SM构成(当然还有其他部份),一个SM含包有多个SP(以及还有寄存器资源,shared memory资源,L1cache,scheduler,SPU,LD/ST单元等等),1.x硬件,一个SM含包8个SP,2.0是32个,2.1是48个,3.0和3.5是192个。以及SP现在也称为CUDA CORE,而SM现在也称为MP,在KEPLER构架(SM3.0和3.5)下也称为SMX。

    

    

    

    从软件度角讲,CUDA因为是SIMT的式形,GRID,block,thread是thread的组织式形。小最的逻辑单位是一个thread,小最的硬件执行单位是thread warp(简称warp),若干个thread(典型值是128~512个)构成一个block,block被加载到SM上行运,多个block构成团体的GRID。

    

    

    这里为什么要有一个间中的次层block呢?这是因为CUDA通过这个念概,供给了细粒度的通信段手,因为block是加载在SM上行运的,所以可以利用SM供给的shared memory和__syncthreads()能功现实线程同步和通信,这带来了很多处好。而block之间,除了结束kernel外之是没法同步的,一般也不证保行运先后顺序,这是因为CUDA序程要证保在不同范围(不同SM数量)的GPU上都可以行运,必须备具范围的可扩展性,因此block之间不能有依附。

    

    

    这就是CUDA的两级行并构结。

    

    

    总而言之,一个kernel对应一个GRID,该GRID又含包若干个block,block内含包若干个thread。GRID跑在GPU上的时候,是能可占独一个GPU的,也是能可多个kernel并发占用一个GPU的(要需fermi及更新的GPU构架持支)。

    

    

    block是resident在SM上的,一个SM可能有一个或多个resident blocks,要需体具根据资源占用分析。

    

    

    每日一道理
古人云:“海纳百川,有容乃大。”人世间,不可能没有矛盾和争吵,我们要以磊落的胸怀和宽容的微笑去面对它 。哈伯德也曾说过:“宽恕和受宽恕的难以言喻的快乐,是连神明都会为之羡慕的极大乐事。”让我们从宽容中享受快乐,从谅解中体会幸福吧!

    thread以warp为单位被SM的scheduler 发射到SP或者其他单元,如SFU,LD/ST unit执行关相操纵,要需等待的warp会被切出(仍然是resident 状态),以空出执行单元给其他warps。

    

    那么有问题 

    1. 1个block是不是只能resident在1个SM里
2. GTX660ti的cuda core是1344,kepler构架,所以应该有7个SM,每一个SM有192个SP,这么懂得对吗?
3. 在GTX660ti上跑一个kernel,如果block number为1,是不是gpu最多载负1/7,这么懂得对吗?

    

    ice大神这样复兴

    

    1:是的,您可以这样帮助斟酌,如果一个block要应用shared memory,此时注意到shared memory是SM上的资源,不同的SM上shared memory是不通信的,也不能互相借用。所以,可以反证,一个block只能resident在一个SM上。

2:kepler构架下的SM(又称SMX)是具有192个SP(又称CUDA CORE)没错,因而应用总的SP数量除以192即得 SM数量。您的懂得是确正的。

3:这个问题说起来略微有点庞杂,因为这个和该block应用资源的情况有关,一般情况下,是没法到达1/7的,也就是说只上一个block的话极可能一个SM都跑不满,(比如这个block面里线程数量非常少,或者线程数量中等但是仍然没法盖掩其他的迟延等)同时一个block最大只能有1024个线程,这对于GPU算计还是少了些。
单简地借用一个数学的念概来说明可能更为明白:“1/7是您GPU占用率的‘上界’,但可能不是‘上确界(小最上界)’,同时,这样做一般来说线程数量太少,没有意义。”

文章结束给大家分享下程序员的一些笑话语录: PC软件体积大,是因为一个PC软件功能往往较多,能够满足你一个方面的需求,而一个iphone软件往往没几行代码,干一件很小的事情,自然需要的软件就多。就像吃西瓜和吃瓜子的来比数目,单位不同啊。

转载于:https://www.cnblogs.com/xinyuyuanm/archive/2013/05/09/3069946.html

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值