GPU中线程和块的执行顺序

JinYun_8034

已于 2022-07-10 16:07:31 修改

阅读量548

点赞数 1

分类专栏： GPU 文章标签： python

于 2022-07-08 15:25:51 首次发布

本文链接：https://blog.csdn.net/weixin_47596483/article/details/125679182

版权

GPU 专栏收录该内容

3 篇文章 1 订阅

订阅专栏

为了搞清楚GPU当中的块和线程是按什么样的顺序来执行的？

修改了一下代码，在内核函数内调用print语句来打印块ID，这里设10个块，每个块1个线程。

import pycuda.driver as cuda

import pycuda.autoinit

from pycuda.compiler import SourceModule

mod = SourceModule("""

    #include <stdio.h>

     __global__ void myfirst_kernel()

       {

        printf("I am in block no: %d \\n", blockIdx.x);

      }

""")

function = mod.get_function("myfirst_kernel")

function(grid=(10, 1), block=(1, 1, 1))

结果：

如果我修改内核调用的代码，用线程来执行就能知道线程的执行顺序，代码如下：

import pycuda.driver as cuda

import pycuda.autoinit

from pycuda.compiler import SourceModule

mod = SourceModule("""

    #include <stdio.h>

     __global__ void myfirst_kernel()

       {

        printf("I am in block no: %d \\n", threadIdx.x);

      }

""")

function = mod.get_function("myfirst_kernel")

function(grid=(1, 1), block=(10, 1, 1))

结果：