一、GPU缓存和变量作用域
1. 缓存类型
(1)GPU缓存是非可编程存储区域
(2)GPU包含4类缓存:
L1缓存,每个流处理器一个
L2缓存,全部流处理器共享一个
L1和L2都可用于存储本地和全局内存中的数据,包括寄存器溢出数据
(3)只读常量缓存,每个流处理器一个
(4)只读纹理缓存,每个流处理器一个
二、静态全局内存传递
- 静态全局内存声明:__device__
- 主机代码不能直接访问静态全局内存
- 为静态全局内存赋值:cudaMemcpyToSymbol
- 获取静态全局内存赋值:cudaMemcpyFromSymbol
内存地址获取
静态全局内存只是GPU上内存块的符号,不能直接使用&获取其内存地址
获取GPU静态全局内存地址:cudaGetSymbolAddress
三、统一虚拟地址
Unified Virtual Addressing,UVA
主机中使用CUDA API分配的内存(页锁定内存、零拷贝内存)与GPU上分配的内存在同一个虚拟内存地址空间
指针属性
- 获取指针属性:cudaPointerGetAttributes
- 属性结构体:cudaPointerAttributes
float *d_mem = NULL;
cudaMalloc((void**)&d_mem, sizeof(float));
cudaPointerAttributes pt_Attribute;
cudaPointerGetAttributes(&pt_Attribute, d_mem);
printf("pointer Attribute: device=%d, device");