CUDA多GPU编程入门 多gpu有几种模式,多线程+cuda,也有通过流并发+cuda stream和异步拷贝 左边的在时间上顺序执行,使用stream可以实现右边的操作——同时做4步操作 note:AB如果都需要做kernel的加载,并且需要使用GPU的内存, 对于左图来说:AB可以占用到最大的GPU内存(占满) 对于右图来说,则两者的总的内存不能超过gpu的总内存 stream使用的步骤:定义流,创建流,销毁流 1:定义了两个流,s1,s2