一般来说,cuda的kernel是顺序执行的,不管是在哪个流上执行kernel,kernel执行引擎会顺序执行kernel。
不过对于支持并发kernel的gpu来说,不同的流执行相同的kernel是可以并发执行的。参见CUDA的sample :6_Advanced\concurrentKernels
还有一种情况就是,不同的流可以并行执行不同的kernel,前提是GPU支持HyperQ,参见CUDA的sample:6_Advanced\simpleHyperQ
一般来说,cuda的kernel是顺序执行的,不管是在哪个流上执行kernel,kernel执行引擎会顺序执行kernel。
不过对于支持并发kernel的gpu来说,不同的流执行相同的kernel是可以并发执行的。参见CUDA的sample :6_Advanced\concurrentKernels
还有一种情况就是,不同的流可以并行执行不同的kernel,前提是GPU支持HyperQ,参见CUDA的sample:6_Advanced\simpleHyperQ