CUDA Samples学习笔记1——Utilities_asyncAPI
讲了CPU和GPU执行时的Overlap(重叠)的问题。先要了解CUDA中的Stream,一个Stream中的操作是由主机代码发布的一系列在设备上发布的操作,必须确保顺序执行。不同的Streams里面的操作可以交叉操作或者并发执行。设备的操作分为数据传输和kernels。
Stream分为default stream和non-defaultstream。当我们没有指定stream时,使用的就是默
原创
2017-03-04 14:33:20 ·
1623 阅读 ·
0 评论