内部存储_GPU内部物理与逻辑结构+存储单元详细总结(计算与存储结构)

本文深入解析GPU的内部结构,包括逻辑执行结构的thread、block、grid和存储结构如寄存器、Local Memory、Shared Memory、Constant Memory、Texture Memory和Global Memory。GPU的逻辑block对应物理SM,线程对应SM中的Core。GPU存储结构按线程、块和格设计,优化关键在于理解其作用域和访问速度。
摘要由CSDN通过智能技术生成

由于最近实验需要在GPU上狠下功夫,所以恶补了GPU的知识。我发现国内blog其实对GPU内部的物理、逻辑的各个组件、对存储单元等总结的并不是特别完备,所以我根据自己的理解以及他人的博客中的内容自己总结了一份GPU相关知识点,用来帮助自己回顾并普及知识。本文承接上一篇

5d17a53a5d85814baeb572aece2cb7ce.png

二、GPU逻辑执行结构

软件概念:

thread-->block-->grid:在利用cuda进行编程时,一个kernel对应一个GRID(http://blog.sina.com.cn/s/blog_80ce3a550101lntp.html),一个grid分为多个block,而一个block分为多个thread,GRID跑在GPU上的时候,可能是独占一个GPU的,也可能是多个kernel并发占用一个GPU的(需要fermi及更新的GPU架构支持)。其中任务划分到是否影响最后的执行效果。划分的依据是任务特性和GPU本身的硬件特性。GRID,BLOCK,THREAD是软件概念,而非硬件的概念。

a38d25e663753e3196858ae96d7a53e2.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值