这里写目录标题
本章主要追踪一下kernel launch的流程,会不断完善。
kernel launch
先抛出一个问题,如果在一个循环中不断的发送kernel(kernel 内部while死循环),会是什么结果。
// kernel 函数
__global__ void kernel(float *a, int n) {
int id = threadIdx.x + blockIdx.x * blockDim.x;
while(1) {
//a[id] = sqrt(a[id] + 1);//这句注释掉对结果没有影响
}
}
// 持续不断的把kernelfun送入某一个具体stream
int main() {
//1. 声明变量(略)
//2. 设置cudaLimitDevRuntimePendingLaunchCo