为了搞清楚GPU当中的块和线程是按什么样的顺序来执行的?
修改了一下代码,在内核函数内调用print语句来打印块ID,这里设10个块,每个块1个线程。
import pycuda.driver as cuda
import pycuda.autoinit
from pycuda.compiler import SourceModule
mod = SourceModule("""
#include <stdio.h>
__global__ void myfirst_kernel()
{
printf("I am in block no: %d \\n", blockIdx.x);
}
""")
function = mod.get_function("myfirst_kernel")
function(grid=(10, 1), block=(1, 1, 1))
结果:
如果我修改内核调用的代码,用线程来执行就能知道线程的执行顺序,代码如下:
import pycuda.driver as cuda
import pycuda.autoinit
from pycuda.compiler import SourceModule
mod = SourceModule("""
#include <stdio.h>
__global__ void myfirst_kernel()
{
printf("I am in block no: %d \\n", threadIdx.x);
}
""")
function = mod.get_function("myfirst_kernel")
function(grid=(1, 1), block=(10, 1, 1))
结果:
从上面的两段代码可知,在GPU的内核调用中,块是随机执行的,线程是按顺序执行的。