摘要
本文主要讲述CUDA的变量修饰符以及其性能。
1. 变量类型
__device__:位于GPU显卡的内存(显存)中,用于全局通信,可称为global memory。
__shared__:共享存储,必须定义在kernal最前,定义时不能赋值。
__constant__:在kernal运行过程中不能修改,但是可以在__host__中修改。
__register__:临时变量(可以选择用__register__修饰)
2. 内存访问速度
访问速度顺序为:register>shared>constant>local>device