
CUDA/NCCL
文章平均质量分 69
cuda nccl知识随笔
zzh_int
这个作者很懒,什么都没留下…
展开
-
GPU通讯-基础篇
本文粗略介绍了gpu在通讯方面的演进,发展,及一些基础的性能调优思路。原创 2025-04-10 13:24:12 · 556 阅读 · 0 评论 -
一些常用的网站链接/脚本
nvidia 一些驱动的发布信息:nvidia 下载驱动的链接:nvidia cuda镜像:获取nvlink带宽: get_nvlink.sh验证hpc工作:test_hpc.sh。原创 2025-04-10 14:13:33 · 165 阅读 · 0 评论 -
NCCL使用指南-进阶篇
前文介绍了NCCL的常用环境变量,本文介绍了NCCL-test性能基准测试,以及一些大规模集群测试的经验数据。原创 2025-04-10 14:42:37 · 512 阅读 · 0 评论 -
离线安装 nvidia-docker2(nvidia-container-toolkit)
很多时候大家都有用docker使用gpu的需求,但是因为网络等原因不是那么好用,这里留了一个给ubuntu的安装包,网络好的话也提供了在线安装方式。原创 2025-04-10 13:45:11 · 312 阅读 · 0 评论 -
什么是cuda: 三个cuda的含义
在我们的机器中,也就是相当于预装了driver cuda和runtime cuda,而且一般driver cuda == runtime cuda,出现这种现象不是巧合,因为driver cuda集成在驱动中,而驱动经常和runtime cuda一起打包发行,所以版本都是相同的,事实上预装时runtime cuda可以低一些,不影响使用。tensorflow 未集成 ----------> 12.5(使用全局cuda)而nvidia-smi 看到的,是driver cuda。原创 2025-04-10 13:17:33 · 246 阅读 · 0 评论 -
nccl使用指南-基础篇
NCCL基础使用原创 2025-04-10 11:50:45 · 981 阅读 · 0 评论