.cu的cuda程序的kernel函数中调用std函数无法编译的问题解决； error: calling a constexpr host function

最新推荐文章于 2022-07-26 19:05:54 发布

Vince541

最新推荐文章于 2022-07-26 19:05:54 发布

阅读量1.3k

点赞数 1

分类专栏： cuda 文章标签： c++

本文链接：https://blog.csdn.net/weixin_38203054/article/details/125110815

版权

cuda 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

引言：本人初学cuda编程，在jetson nano 4G上想实现sliced wasserstein distance的各个slice并行加速计算，遇到一些问题和解决方案，记录在此。

基础知识：在cuda编程中，cpu称作host，gpu称作device。在gpu上并行运算的函数称作kernel function，其编写在.cu, .cuh程序中，与.cpp, .h对应。编译规则可以用同目录下的对应的CMakeList.txt。

问题：编译报错如下

error: calling a constexpr __host__ function("make_pair") from a __global__ function("emd") is not allowed. The experimental flag '--expt-relaxed-constexpr' can be used to allow this.

对应代码为kernel.cu的：

for (int i = 0; i < M; i++) {

cloud1Idx[i] = std::make_pair(proj.proj(cloud1[i]), i);

}

中使用了std::make_pair这个std库中的函数。

解决方法如报错中所说，添加编译选项“--expt-relaxed-constexpr”在同目录下的对应的CMakeList.txt中：

set(CUDA_NVCC_FLAGS --expt-relaxed-constexpr)

随后报错消失。

参考：

【1】cuda - How to invoke a constexpr function on both device and host? - Stack Overflow

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Vince541

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Cuda函数调用

zxy1198186906的博客

01-06

2014

cuda的基础函数说明

RuntimeError: CUDA error: CUBLAS_STATUS_INVALID_VALUE when calling `cublasGemmEx 解决方案

最新发布

weixin_43178406的博客

06-12

8万+

本文主要介绍了RuntimeError: CUDA error: CUBLAS_STATUS_INVALID_VALUE when calling `cublasGemmEx 解决方案，希望能对学习pytorch的同学们有所帮助。文章目录 1. 问题描述 2. 解决方案

参与评论您还未登录，请先登录后发表或查看评论

32位算术逻辑运算单元alu设计_CUDA程序设计入门（一）——SM和SP

weixin_39778106的博客

11-15

854

写在前面最近实验室的项目需要使用GPU做加速，因此入门了CUDA（Compute Unified Device Architecture）。为整理知识、完成知识的输出和巩固，开个新坑记录CUDA程序设计的心得。文章内容主要围绕本人磕盐搬砖时面临的实际问题展开，大部分篇幅参考自Shane Cook编写的《CUDA Programming - A Developer's Guide to Parall...

ubuntu上运行Cuda C程序未执行核函数

qq_38364953的博客

09-05

871

刚一开始以为是tx2上安装的cuda出问题了，但是例程中的程序可以正常运行，后来用makefile解决的解决办法： 1、首先利用sudo su切换到root用户下将Makefile粘贴到和程序相同的目录下，用sudo - nvidia切换到nvidia用户。 2、（1）改：打开Makefile文件到文件底部，将bulid：后面改成自己定义的可执行文件的名字，还有二进制文件（格式为,o)（...

CUDA 调用kernel函数时调用不到，也不报错

qq_43134830的博客

03-10

1761

第一次使用CUDA编程环境：ubuntu18.04 clion2020.3 cuda11.2 GPU版本：GEFORCE 940MX 复制粘贴了网上最简单的"Hello, cuda"，在kernel函数中输出，结果什么都没有，心态崩了。总结原因： 1.需要确定自己的GPU计算能力可以在NVIDIA官网上查询，或者cuda 计算能力查询表还有一种查看方式，可以运行NVIDIA_CUDA_Samples/1_Utilities/deviceQuery的代码，运行结果如图我的CUDA Capabilit

疑问：CLion里不执行CUDA核函数

weixin_38423729的博客

12-18

312

在windows系统下，安装CUDA环境和VS后，VS可以正常执行CUDA核函数，打印核函数里的printf语句，为什么使用CLion运行就无法打印核函数里的printf语句？

cuda数学库函数提示error : calling a __host__ function

Kelvin_Yan的专栏

08-10

1796

max函数识别为标准库里的了 error : calling a host function("std::max ") from a device function(“func”) is not allowed 查了在线问答，明明有这个函数啊？原来是cuda版本太老了，文档要看对应版本的，查看方法是在线文档页面的右上角“older”，点进去找到自己的版本，看这个章节CUDA Math API ...

CUDA常见问题之无法在c文件中调用cu文件中定义的函数

Warren_Hoo的专栏

10-13

3446

当在C源文件中调用cu文件中定义的函数时，会出现undefined reference的问题，而在C++源文件中调用cu文件中定义的函数时则不会出现这个问题。出现上述问题的原因是，nvcc编译器采用的是C++的编译规则，而C和C++对函数名的编译规则不同。要解决上述问题，只需要在cu文件中定义的函数前加上extern "C"即可，这样nvcc编译器就会按照C的编译规则来编译该函数了。

从源码安装人脸Dlib库报错。cuda_dlib.cu(1762): error

HelloWor1d的博客

06-06

1040

从GitHub上下载源码Dlib库进行安装时，报如下错误： [ 1%] Building NVCC (Device) object dlib/CMakeFiles/dlib.dir/cuda/dlib_generated_cuda_dlib.cu.o /home/zjb/dlib/dlib/cuda/cuda_dlib.cu(1762): error: calling a constexpr __host__ function("log1p") from a __device__ function(".

SAP FRC接口调用calling RFC_METADATA_GET -- see log for details报错解决方案

08-23

解决的问题：现象：如果SAP服务端是2022年最新的7700版本(实施商的说法，实际是否最新有待证实)；通过NuGet或网上找的一下DLL库都太老了，在一切配置都正常的情况下调用repository.CreateFunction("接口名")时报...

OpenPose编译生成错误calling a __host__ function(“__floorf“) is not allowed

weixin_44313626的博客

03-14

2232

之前博客介绍过一种针对MSB8066的解决办法，但后续仍然出现错误无法成功编译openpose 后来观察报错信息实际上问题主要出在了 “calling a host function(”__floorf") from a global function("op::resize8TimesKernel “) is not allowed” 这里关于floor函数调用之上。我们需要找到对应调用floor函数的位置 ctrl+F搜索"floor"并把调用"floor"的地方都改为"floorf" 即可完成生

pytorch报错：RuntimeError: CUDA error: CUBLAS_STATUS_ALLOC_FAILED when calling `cublasCreate(handle)`

科研学习笔记！

07-13

6427

多GPU分布式运行pytorch程序报错：RuntimeError: CUDA error: CUBLAS_STATUS_ALLOC_FAILED when calling ‘cublasCreate(handle)`

CUDA:核函数未执行，错误检查

Yan

12-23

7670

最近在使用CUDA时，遇到某次代码在执行时，直接跳过CUDA核函数。又由于CUDA程序本身不是非常便于调试，所以在此时如果能知道程序为什么会报错，对进一步代码改正会有非常大的帮助。解决方案在核函数之后，添加一行代码。使用此函数，就会输出核函数非常正常执行的原因。 cudaError_t cudaStatus = cudaGetLastError(); if (cudaStatus !

CUDA kernel函数不执行、不报错的问题

weixin_43414513的博客

02-08

7316

CUDA 核函数不执行、不报错的问题最近使用CUDA的时候发现了一个问题，有时候kernel核函数既不执行也不报错。而且程序有时候可以跑，而且结果正确；有时候却不执行，且不报错，最后得到错误的结果。这种情况一般是因为显存访问错误导致的。我发现如果有别的程序同时占用着GPU在跑的时候，且占用的显存非常大的时候，我再执行一个CUDA程序 (比如我另一篇博客写的归并排序的CUDA加速) 时，kernel函数就会不执行而导致结果错误，但是如果调用一张空闲GPU卡就能跑出正确结果。解决方案：为了解决不报错的问

高版本CUDA 在算力低的显卡上不执行核函数如no kernel image is available for execution on the device

未觉池塘春草梦，阶前梧叶已秋声

02-04

1920

在之前的笔记本上（显卡 GT 640M，算力3.0）装了CUDA10 ，每次执行核函数的时候都会直接跳过，参考了这篇博文，在核函数后面加入 cudaError_t cudaStatus = cudaGetLastError(); if (cudaStatus != cudaSuccess) { fprintf(stderr, "addKernel launch failed: %s\n", cudaGetErrorString(cudaStatus)); } 报错no.

cuda 显存错误导致核函数执行失败

学海无涯苦作舟

07-26

601

cuda 核函数执行失败

calling a __host__ function("XXX") from a __global__ function is not allowed

愿世界和平的IT劝退师

01-06

8205

原因一： error : calling a __host__ function("fmod ") from a __global__ function This is happening because of a template argument mismatch. You are calling fmod with a floating point argument an

Cuda kernel failed. Error: invalid device function

lianbus的专栏

05-30

2494

在编译caffe后使用 make runtest时候，会出现一些这样的问题，实际上问题是出现在makefile.config中的。。。 F0221 16:54:21.855986 11564 im2col.cu:49] Cuda kernel failed. Error: invalid device function *** Check failure stack trace

python中__call__内置函数用法实例

09-21

### Python中的`__call__`内置函数详解在Python中，`__call__`方法是一个特殊的方法，允许类的实例像函数那样被调用。这一特性使得Python代码更加灵活和富有表现力。接下来，我们将深入探讨`__call__`方法的工作...

.cu的cuda程序的kernel函数中调用std函数无法编译的问题解决； error: calling a constexpr __host__ function

.cu的cuda程序的kernel函数中调用std函数无法编译的问题解决； error: calling a constexpr host function