CUDA一些基础名词讲解:
主机:cpu和memory(内存)
设备:gpu和memory(显存)
warp:thread
函数类型限定符:__global__ __host__ __device__
变量类型限定符: __device__ __shared__ __constant__
thread:线程
block:多个线程组成(举个例子 一个10*10的矩阵 去遍历每个数 通常需要写两个for循环,而并行计算的核心是线程,我们创建10*10,就是100个线程,每个线程负责一个数,这样速度就会比两个for循环快得多)
grid:多个block组成
SIMT:单指令 多线程
内置变量:threadid blockid bolckim gridid gridim