CUDA C
文章平均质量分 78
日晨难再
杂学旁收
展开
-
CUDA C:查看GPU设备信息
了解自己设备的性能是很有必要的,为此CUDA 运行时(runtime)API给用户也提供了一些查询设备信息的函数,下面的函数用于查看GPU设备的一切信息。原创 2024-02-29 20:55:05 · 1258 阅读 · 12 评论 -
CUDA C:核函数、主机函数、设备函数
主机函数(Host Function)指的是在主机(CPU)调用,在主机(CPU)上执行的函数,可以使用__host__限定符修饰,一个普通的C函数其实就是一个主机函数。核函数(Kernel Function)指的是在主机(CPU)调用(某些情况下也可以在设备调用),在设备(GPU)上执行的函数,使用__global__限定符修饰。设备函数(Device Function)指的是在设备(GPU)调用,在设备(GPU)上指定的函数,使用__device__限定符修饰。也可以在设备调用,设备执行。原创 2024-02-26 00:46:18 · 774 阅读 · 13 评论 -
CUDA C:线程、线程块与线程格
一个线程格由多个线程块(block)构成,一个线程块由包含若干线程,同一线程块内的线程可以通过以下两种方式协作,而不同线程块内线程不能协作。为什么这两个结构都是三个分量,因为CUDA最多支持组织三维的层次结构,即线程块在线程格中的分布最多有三个维度,而线程在线程块中的分布最多有三个维度。线程通过下面两个核函数的预置变量来区分彼此,预置变量代表着CUDA在运行时为每一个进程都分配了这两个变量,基于这两个变量,可以将一块数据分给不同的进程处理。根据定义,这两个变量可以通过下面的方式访问结构的成员。原创 2023-12-18 20:57:13 · 1376 阅读 · 25 评论