CUDA系列-Kernel Launch-8

泰勒朗斯

已于 2024-06-26 10:18:21 修改

阅读量2.2k

点赞数 25

分类专栏： GPU 文章标签： linux 机器学习 cuda

于 2024-06-19 16:34:13 首次发布

本文链接：https://blog.csdn.net/weixin_43360707/article/details/139806834

版权

这里写目录标题

kernel launch

本章主要追踪一下kernel launch的流程，会不断完善。

kernel launch

先抛出一个问题，如果在一个循环中不断的发送kernel（kernel 内部while死循环），会是什么结果。

// kernel 函数
__global__ void kernel(float *a, int n) {
   
  int id = threadIdx.x + blockIdx.x * blockDim.x;
  while(1) {
   
     //a[id] = sqrt(a[id] + 1);//这句注释掉对结果没有影响
  }
}
 
// 持续不断的把kernelfun送入某一个具体stream
int main() {
   
//1. 声明变量（略）
 
//2. 设置cudaLimitDevRuntimePendingLaunchCo