GPU上缘何没有大量的cache

最新推荐文章于 2021-12-14 22:49:00 发布

Tommy_wxie

最新推荐文章于 2021-12-14 22:49:00 发布

阅读量2.4k

点赞数

分类专栏： GPGPU

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tommy_wxie/article/details/75795684

版权

GPGPU 专栏收录该内容

6 篇文章 1 订阅

订阅专栏

近年来，GPU广泛应用与高性能领域，其通用计算能力也得到了进一步的利用。与传统的CPU相比，GPU在处理能力和储存器带宽上有着明显的优势，在成本和功耗上也不需要付出太大的代价。

在当前主流的CPU+GPU架构中，CPU和GPU一般经过北桥芯片相互连接，各自有各自的外部储存器，分别为内存和显存。在这种混合架构中CPU负责逻辑性较强的事物运算，而GPU主要负责计算密集度较高的部分。其设计目的的不同导致了设计时的架构的不同。而这些架构的不同也最终影响了他们的性能。

CPU为何需要大量cache

对于单个的CPU核心通常在一个时刻只能运行一个线程的指令，其多线程机制也是在软件层次上的并行。当一个线程中断，或等待某些资源的时候，操作系统需要进行一个上下文转换，这通常会带来巨大的开销。因此需要大量的cache来过滤过多内存的访问，减少访存的延迟，提升CPU的响应速度。而为了缓存的一致性，还需要复杂的替换机制，需要复杂的逻辑控制单元。

另一方面，为了提升单核指令级的并行，现代的CPU中使用了超标量、超流水、超长指令字。这些方式的运行也需要借助复杂的分支预测机制和大量的cache。

GPU为何不需要大量cache

在GPU中没有复杂的缓存体系和替换机制，其cache都是只读的，因此不用考虑cache一致性问题。GPU缓存的主要作用是过滤对存储器控制器的请求，减少对显存的访问，从而解决显存带宽。

GPU不需要大量的cache，另一个重要的原因是GPU处理大量的并行任务。其大量的block和同一个block的大量thread保证了GPU可以实现零开销的线程切换。当一个线程因等待资源而中断的时候就转到另一个已经就绪线程去执行，在这里线程切换反而成了一件好事。能通过计算来隐藏延迟。

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
GPU上缘何没有大量的cache

近年来，GPU广泛应用与高性能领域，其通用计算能力也得到了进一步的利用。与传统的CPU相比，GPU在处理能力和储存器带宽上有着明显的优势，在成本和功耗上也不需要付出太大的代价。在当前主流的CPU+GPU架构中，CPU和GPU一般经过北桥芯片相互连接，各自有各自的外部储存器，分别为内存和显存。在这种混合架构中CPU负责逻辑性较强的事物运算，而GPU主要负责计算密集度较高的部分。其
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。