GPU-Direct P2P
1.背景
GPU在高性能计算和深度学习加速中扮演着非常重要的角色, GPU的强大的并行计算能力,大大提升了运算性能。随着运算数据量的不断攀升,GPU间需要大量的交换数据,GPU通信性能成为了非常重要的指标。NVIDIA推出的GPUDirect就是一组提升GPU通信性能的技术。但GPUDirect受限于PCI Expresss总线协议以及拓扑结构的一些限制,无法做到更高的带宽,为了解决这个问题,NVIDIA提出了NVLink总线协议。
- GPUDirect介绍
2.1 简介
GPUDirect技术有如下几个关键特性:
加速与网络和存储设备的通信:
GPU之间的Peer-to-Peer Transers
GPU之间的Peer-to-Peer memory access
RDMA支持
针对Video的优化
下面对最主要的几个技术做分别介绍。
2.2 Shared Memory
2010年6月最先引入的是GPUDirect Shared Memory 技术,支持GPU与第三方PCI Express设备通过共享的pin住的host memory实现共享内存访问从而加速通信。
2.3 P2P
2011年,GP