GPU 内存结构

最新推荐文章于 2024-05-01 00:03:32 发布

xieshangxin

最新推荐文章于 2024-05-01 00:03:32 发布

阅读量2.1k

点赞数 3

文章标签：内存管理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xieshangxin/article/details/108863182

版权

GPU 和CPU通过 VLink 或者PCLe 相连。

每个SM 又含有多个cuda core，多个SM共享全局内存，通过L2 高速缓存和全局内存进行相连，不同代的GPU之间的体系结构有所不同。

右边是一个SM 上的内存，有共享内存，局部内存，寄存器，可以访问全局内存、常数内存、纹理内存。

每个线程有自己的私有本地内存（local memory）、每个线程块包含共享内存，可以被线程块中的所有线程共享，其生命周期与线程块一致。共享内存的访问速度非常块，比全局内存的访问要快100倍。

所有的线程都可以访问全局内存，量大，但是访问速度是最慢的

常量和纹理内存用的比较少，所有的线程都能对它们进行读操作，不能进行写操作。

多个MP共享L2

存储量越大访问速度越慢。CPU/GPU 的内存结构中，一级和二级缓存都是不可编程的，对用户是不开放的（完全不可控制的存储设备）。比如 L1 L2 缓存，寄存器，是不可编程的，是有cpu 、GPU进行管理控制的。

全局内存生命周期是从开始申请到释放，如果程序结束了，但是没有对释放内存的操作，全局内存的生命周期还是没有结束、

全局内存生命周期（显存）：

当一个线程开始执行，它会拥有自己的本地内存、寄存器，当线程结束时，对应的内存也就结束了。

最低0.47元/天解锁文章

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
1
评论
GPU 内存结构

GPU 和CPU通过 VLink 或者PCLe 相连。每个SM 又含有多个cuda core，多个SM共享全局内存，通过L2 高速缓存和全局内存进行相连，不同代的GPU之间的体系结构有所不同。右边是一个SM 上的内存，有共享内存，局部内存，寄存器，可以访问全局内存、常数内存、纹理内存。每个线程有自己的私有本地内存（local memory）、每个线程块包含共享内存，可以被线程块中的所有线程共享，其生命周期与线程块一致。共享内存的访问速度非常块，比全局内存的访问要快100倍。所有的线...
复制链接

扫一扫

xieshangxin CSDN认证博客专家 CSDN认证企业博客

码龄7年

115: 原创

5万+: 周排名

170万+: 总排名

19万+: 访问

: 等级

2351: 积分

58: 粉丝

109: 获赞

37: 评论

657: 收藏

私信

关注

热门文章

分类专栏

Ubuntu 2篇
软链接 1篇
空间不足 1篇

最新评论

opencv 物体尺寸测量
天是天海是海: 像素和真实距离换算比怎么确定的
t-SNE的通俗易懂解释
Christina-mc: 讲得很好！能懂！但是好像戛然而止了，没写完？
t-SNE的通俗易懂解释
halo～*: 你好，我想问可视化后横纵坐标是啥
opencv 物体尺寸测量
Seven、K: 这种方法是不是需要相机拍照时垂直于目标
opencv 物体尺寸测量
mlh1290: 请问，测量精度能达到0.01mm么？配合高速摄像机能达到每秒120次计算么？？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

xieshangxin 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。