mysql yuancheng nv_GPU前沿：NVLink与PCIe的对比学习

最新推荐文章于 2024-06-26 10:12:06 发布

weixin_39750190

最新推荐文章于 2024-06-26 10:12:06 发布

阅读量1.3k

点赞数

文章标签： mysql yuancheng nv

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39750190/article/details/113594862

版权

本文深入探讨GPU的NVLink 2.0技术，对比PCIe 3.0，展示NVLink在带宽、延迟和随机访问性能上的优势。通过实验，证明NVLink在哈希连接等大数据处理中的高效性，并讨论了其对CPU-GPU数据传输的影响，强调了cache一致性的重要性。文章还指出，未来研究应考虑在NVLink基础上的新型应用发展。

摘要由CSDN通过智能技术生成

本文主要是对《Pump Up the Volume: Processing Large Data on GPUs with Fast Interconnects》的阅读，同时记录了自己的一些想法。

本文针对GPU的NVLink进行进一步研究，阅读下来感觉非常前沿，能学习很多insight。所以我将本文总结出来，加深自己的理解，也方便读者阅读。

本文为SIGMOD’20的文章，感兴趣的同学可以下载来自行阅读。

一、前沿与背景

1 背景

贡献：

1 分析NVLink 2.0并理解其性能以及新特性；

2 对接口的传输速度进行实验探究，并采取最后的数据传输策略；

3 提出新的方案使得GPU-CPU能更好的协同工作；

4 测试；

背景部分需要我们了解哈希join算法，文章中使用的无分区的哈希合并，由于该算法能够很好的测试GPU与CPU的性能，所以全文以该算法贯穿，并在NVLink2.0的基础上对该算法进行重设计，使其更高效。

f9de33c7a2dc

2、PCIe-3.0知识

PCIe具有两种数据传输的原语，memory-mapped I/O(MMIO)以及DMA。其中MMIO将GPU的显存与GPU地址空间相连。CPU使用load和store指令对数据进行访问。

DMA是的GPU能直接访问CPU的内存，而与MMIO的不同点是DMA能直接访问pinned memory。(在我理解来，就是普通的malloc与cudamalloc的区别ÿ

最低0.47元/天解锁文章

weixin_39750190

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。