CUDA:核函数未执行，错误检查

最新推荐文章于 2024-08-23 09:44:21 发布

yanqs_whu

最新推荐文章于 2024-08-23 09:44:21 发布

阅读量7.6k

点赞数 4

分类专栏： CUDA 文章标签： cuda

本文链接：https://blog.csdn.net/u012348774/article/details/78882001

版权

CUDA 专栏收录该内容

17 篇文章 1 订阅

订阅专栏

最近在使用CUDA时，遇到某次代码在执行时，直接跳过CUDA核函数。
又由于CUDA程序本身不是非常便于调试，所以在此时如果能知道程序为什么会报错，对进一步代码改正会有非常大的帮助。

解决方案

在核函数之后，添加一行代码。使用此函数，就会输出核函数非常正常执行的原因。

   cudaError_t cudaStatus = cudaGetLastError();
    if (cudaStatus != cudaSuccess) 
    {
        fprintf(stderr, "addKernel launch failed: %s\n", cudaGetErrorString(cudaStatus));
        goto Error;
    }

示例

首先我将演示一下该现象，使用的代码是CUDA本身自带的向量加法计算器，我只对核函数进行了修改，代码如下：

__global__ void addKernel(int *c, const int *a, const int *b)
{
    double test1[20000000];//看起来很夸张，但主要是示例
    int i = threadIdx.x;
    c[i] = a[i] + b[i];
}

得到程序错误原因，结果如下。

addKernel launch failed: invalid argument
addWithCuda failed!请按任意键继续.

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

yanqs_whu

关注关注

4
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Cuda函数调用

zxy1198186906的博客

01-06

1974

cuda的基础函数说明

Image_Convolution_CUDA:通过使用共享和恒定内存在CUDA中进行2D图像卷积

05-23

6. **CUDA C++编程**：实现2D图像卷积通常涉及到CUDA C++编程，包括定义设备函数、主机函数，使用`cudaMalloc`、`cudaMemcpy`等函数进行内存分配和数据传输，以及错误检查和资源释放。 7. **CUDA运行时库**：CUDA...

参与评论您还未登录，请先登录后发表或查看评论

常见的cuda出错及解决方法

最新发布

qq_23022733的博客

08-23

700

安装的 PyTorch 版本和 CUDA 版本不兼容。可以重新安装与系统上 CUDA 版本匹配的 PyTorch 版本。CUDA 版本与 GPU 驱动程序或 PyTorch 安装的 CUDA 编译版本不兼容。安装完成后，就可以完美解决这个Bug！

CUDA kernel函数不执行、不报错的问题

weixin_43414513的博客

02-08

7052

CUDA 核函数不执行、不报错的问题最近使用CUDA的时候发现了一个问题，有时候kernel核函数既不执行也不报错。而且程序有时候可以跑，而且结果正确；有时候却不执行，且不报错，最后得到错误的结果。这种情况一般是因为显存访问错误导致的。我发现如果有别的程序同时占用着GPU在跑的时候，且占用的显存非常大的时候，我再执行一个CUDA程序 (比如我另一篇博客写的归并排序的CUDA加速) 时，kernel函数就会不执行而导致结果错误，但是如果调用一张空闲GPU卡就能跑出正确结果。解决方案：为了解决不报错的问

CUDA：核函数不执行，错误检查出现“addKernel launch failed: invalid configuration argument”

liu_feng_zi_的专栏

11-21

4737

开门见山。执行.cu文件时，发现根本没有执行核函数，在核函数后面加入下面代码： cudaError_t cudaStatus = cudaGetLastError(); if (cudaStatus != cudaSuccess) { fprintf(stderr, "addKernel launch failed: %s\n", cudaGetErrorString(cu...

高版本CUDA 在算力低的显卡上不执行核函数如no kernel image is available for execution on the device

未觉池塘春草梦，阶前梧叶已秋声

02-04

1886

在之前的笔记本上（显卡 GT 640M，算力3.0）装了CUDA10 ，每次执行核函数的时候都会直接跳过，参考了这篇博文，在核函数后面加入 cudaError_t cudaStatus = cudaGetLastError(); if (cudaStatus != cudaSuccess) { fprintf(stderr, "addKernel launch failed: %s\n", cudaGetErrorString(cudaStatus)); } 报错no.

32位算术逻辑运算单元alu设计_CUDA程序设计入门（一）——SM和SP

weixin_39778106的博客

11-15

825

写在前面最近实验室的项目需要使用GPU做加速，因此入门了CUDA（Compute Unified Device Architecture）。为整理知识、完成知识的输出和巩固，开个新坑记录CUDA程序设计的心得。文章内容主要围绕本人磕盐搬砖时面临的实际问题展开，大部分篇幅参考自Shane Cook编写的《CUDA Programming - A Developer's Guide to Parall...

cuda核函数不执行

08-29

当其他程序占用了大量显存并且同时运行时，再执行CUDA程序时，核函数可能不会执行，导致结果错误。为了解决这个问题，可以尝试以下解决方案： 1. 检查显存的使用情况，确保没有其他程序占用了过多的显存资源。如果...

CUDA加速的频谱搬移 fftshift_qt.rar

11-05

2. **定义核函数**：编写CUDA核函数，这是在GPU上执行的计算核心。核函数应包含fftshift的逻辑，包括如何交换数组的部分元素。 3. **启动计算**：使用`cudaLaunchKernel`启动核函数，指定线程块和网格尺寸以适应...

cuda-experiments:CUDA实验

04-10

9. **错误处理**：CUDA编程中必须注意错误处理，因为错误检查可以帮助开发者发现潜在的问题，例如，使用`cudaGetErrorString`获取错误信息，确保程序的稳定性和可靠性。 10. **应用领域**：CUDA广泛应用于科学计算...

疑问：CLion里不执行CUDA核函数

weixin_38423729的博客

12-18

292

在windows系统下，安装CUDA环境和VS后，VS可以正常执行CUDA核函数，打印核函数里的printf语句，为什么使用CLion运行就无法打印核函数里的printf语句？

CUDA 调用kernel函数时调用不到，也不报错

qq_43134830的博客

03-10

1726

第一次使用CUDA编程环境：ubuntu18.04 clion2020.3 cuda11.2 GPU版本：GEFORCE 940MX 复制粘贴了网上最简单的"Hello, cuda"，在kernel函数中输出，结果什么都没有，心态崩了。总结原因： 1.需要确定自己的GPU计算能力可以在NVIDIA官网上查询，或者cuda 计算能力查询表还有一种查看方式，可以运行NVIDIA_CUDA_Samples/1_Utilities/deviceQuery的代码，运行结果如图我的CUDA Capabilit

cuda 显存错误导致核函数执行失败

学海无涯苦作舟

07-26

580

cuda 核函数执行失败

报错addKernel launch failed

Aco_ustic的博客

11-13

451

Cuda学习记录 1 遇到的问题和解决：在下载安装了cuda后，用vs新建项目，使用cuda的模板运行时一直报错addKernel launch failed:no kernel image is available for execution on the device 通过学习文章 https://blog.csdn.net/DSQ_17/article/details/47836921?utm_source=blogkpcl9 ...

ubuntu上运行Cuda C程序未执行核函数

qq_38364953的博客

09-05

858

刚一开始以为是tx2上安装的cuda出问题了，但是例程中的程序可以正常运行，后来用makefile解决的解决办法： 1、首先利用sudo su切换到root用户下将Makefile粘贴到和程序相同的目录下，用sudo - nvidia切换到nvidia用户。 2、（1）改：打开Makefile文件到文件底部，将bulid：后面改成自己定义的可执行文件的名字，还有二进制文件（格式为,o)（...

Darknet问题：CUDA Error: __global__ function call is not configured

竭尽全力的专栏

11-15

2030

在机器上跑darknet模型时，被CUDA Error这个问题困扰了好久。完整问题如下：我们可以看到出现CUDA Error: __global__ function call is not configured的提示。解决方案：进入root环境下运行darknet_ros.launch则不会出现上面的CUDA Error问题。步骤如下...

.cu的cuda程序的kernel函数中调用std函数无法编译的问题解决； error: calling a constexpr __host__ function

weixin_38203054的博客

06-03

1257

error: calling a constexpr __host__ function("make_pair") from a __global__ function("emd") is not allowed. The experimental flag '--expt-relaxed-constexpr' can be used to allow this.

解决办法：addKernel launch failed: no kernel image is available for execution on the device

weixin_54672021的博客

08-28

1843

-在第一次运行CUDA runtime时，出现以下报错： addKernel launch failed: no kernel image is available for execution on the device addWithCuda failed! 问题分析编译器中的算例设置与显卡算例不匹配解决办法： 1.安装Nsight ，在vs中按图片点击打开 system info,查看显卡算力，图中我的算力为5.0，SM为5。 2.vs打开项目-项目属性-CUDA-Device 按照我的显