NVIDIA OpenSHMEM Library (NVSHMEM) Documentation
NVIDIA OpenSHMEM Library (NVSHMEM) Documentation — NVSHMEM 3.2.5 documentation
NVSHMEM为NVIDIA® GPU集群实现了OpenSHMEM并行编程模型。该技术采用分区全局地址空间(PGAS)架构,可将内存跨GPU扩展,并提供以下功能接口:
- 支持在CUDA内核内部直接发起细粒度GPU-GPU数据传输
- 支持基于CUDA流的数据传输
- 支持从CPU端发起数据传输
目录:
-
- 示例程序 Example NVSHMEM Program
- InfiniBand GPUDirect异步传输 Using the NVSHMEM InfiniBand GPUDirect Async Transport
- 与MPI/OpenSHMEM协同使用 Using NVSHMEM With MPI or OpenSHMEM
- 程序编译 Compiling NVSHMEM Programs
- 程序运行 Running NVSHMEM Programs
- 通信模型 Communication Model
- 数据一致性机制 Data Consistency
- 多进程GPU支持 Multiprocess GPU Support
- 应用/库构建指南 Building NVSHMEM Applications/Libraries
-
- 接口概览 Overview of the APIs
- 库初始化与查询 Library Setup, Exit, and Query
- 线程支持 Thread Support
- 内核启动例程 Kernel Launch Routines
- 内存管理 Memory Management
- 团队管理 Team Management
- 远程内存访问 Remote Memory Access
- 原子内存操作 Atomic Memory Operations
- 信号操作 Signaling Operations
- 集合通信 Collective Communication
- 点对点同步 Point-To-Point Synchronization
- 内存顺序控制 Memory Ordering