CUDA学习笔记0929

m0_46521579

已于 2023-09-30 09:50:57 修改

阅读量249

点赞数

分类专栏： CUDA 文章标签：学习笔记

于 2023-09-29 01:08:48 首次发布

本文链接：https://blog.csdn.net/m0_46521579/article/details/133397879

版权

CUDA 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

一、GPU缓存和变量作用域

1. 缓存类型

（1）GPU缓存是非可编程存储区域

（2）GPU包含4类缓存：

L1缓存，每个流处理器一个

L2缓存，全部流处理器共享一个

L1和L2都可用于存储本地和全局内存中的数据，包括寄存器溢出数据

（3）只读常量缓存，每个流处理器一个

（4）只读纹理缓存，每个流处理器一个

二、静态全局内存传递

静态全局内存声明：__device__
主机代码不能直接访问静态全局内存
为静态全局内存赋值：cudaMemcpyToSymbol
获取静态全局内存赋值：cudaMemcpyFromSymbol

内存地址获取

静态全局内存只是GPU上内存块的符号，不能直接使用&获取其内存地址

获取GPU静态全局内存地址：cudaGetSymbolAddress

三、统一虚拟地址

Unified Virtual Addressing，UVA

主机中使用CUDA API分配的内存（页锁定内存、零拷贝内存）与GPU上分配的内存在同一个虚拟内存地址空间

指针属性

获取指针属性：cudaPointerGetAttributes
属性结构体：cudaPointerAttributes

float *d_mem = NULL;
cudaMalloc((void**)&d_mem, sizeof(float));
cudaPointerAttributes pt_Attribute;
cudaPointerGetAttributes(&pt_Attribute, d_mem);
printf("pointer Attribute: device=%d, device");

m0_46521579

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CUDA学习笔记0929

（1）GPU缓存是非可编程存储区域（2）GPU包含4类缓存：L1缓存，每个流处理器一个L2缓存，全部流处理器共享一个L1和L2都可用于存储本地和全局内存中的数据，包括寄存器溢出数据（3）只读常量缓存，每个流处理器一个（4）只读纹理缓存，每个流处理器一个。
复制链接

扫一扫

专栏目录