python pcie通信_NCCL(Nvidia Collective multi-GPU Communication Library) Nvidia英伟达的Multi-GPU多卡通信框架NCCL ...

最新推荐文章于 2024-07-03 16:33:02 发布

weixin_29200485

最新推荐文章于 2024-07-03 16:33:02 发布

阅读量847

点赞数

文章标签： python pcie通信

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_29200485/article/details/114912024

版权

本文介绍了NVIDIA Collective Multi-GPU Communication Library (NCCL) 在Python PCIE通信中的应用，探讨了多GPU间的通信方式如Nvlink、PCIe switch、Infiniband和PCIe Host Bridge，并提供了NCCL的编译安装步骤以及测试示例，旨在帮助读者理解并实现高效的多GPU通信。

摘要由CSDN通过智能技术生成

为了了解，上来先看几篇中文博客进行简单了解：

内容摘录：

通信性能(应该主要侧重延迟)是pcie switch > 同 root complex (一个cpu接几个卡) > 不同root complex(跨cpu 走qpi)。ib的gpu direct rdma比跨cpu要快，所以甚至单机八卡要按cpu分成两组，每组一个switch，下面四个卡，一个ib，不通过cpu的qpi通信，而是通过ib通信。- 摘自评论

对于多个GPU卡之间相互通信，硬件层面上的实现有Nvlink、PCIe switch(不经过CPU)、Infiniband、以及PCIe Host Bridge(通常就是借助CPU进行交换)这4种方式。而NCCL是Nvidia在软件层面对这些通信方式的封装。

保持更新，更多内容，请参考cnblogs.com/xuyaowen;

z390 芯片组资料：

P2P 显卡通信性能测试：

cuda/samples/1_Utilities/p2pBandwidthLatencyTest

nvidia 驱动安装：

nccl 编译安装过程：

git clone git@github.com:NVIDIA/nccl.git

cd nccl

make -j src.build (进行编译)

cd build

ex

最低0.47元/天解锁文章

weixin_29200485

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。