[未解决]TensorRT推理过程CUBLAS_STATUS_EXECUTION_FAILED

使用tensorRT进行YoloV3检测时,在运行tensorRT的m_Context->enqueue函数时,出现了下面所示的bug:
ERROR: c:\p4sw\sw\gpgpu\MachineLearning\DIT\release\5.1\engine\cuda\cublasHelpers.cpp (34) - cuBLAS Error in nvinfer1::stridedGemm: 13 (CUBLAS_STATUS_EXECUTION_FAILED)
造成的问题是,yoloV3三个尺度的输出仅获取了第一个尺度的数据,后两个尺度的数据未获取到(显示是未下载到内存中)。

google,stackoverflow,tensorRT讨论区均为找到同样的bug,后来发现该bug仅在第一批次的数据推理过程中出现,后面批次推理不会再出现同样的bug。因此解决方案是设定一个warmup的过程,任一模型加载完成之后首先进行一次数据的前向处理,然后再开始接收实时数据进行检测。

该解决方案是暂时的权益之计,希望大神指导!

CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasGemmEx`是一个CUDA错误,通常发生在使用PyTorch进行深度学习计算时。这个错误表示在调用`cublasGemmEx`函数时出现了执行失败的情况。 根据你提供的引用内容,这个错误可能有多个原因。一种可能性是维度不匹配,但你已经确认不存在这个问题。另一种可能性是CUDA设备设置不一致,可能导致错误。你可以尝试将所有文件的CUDA设备设置保持一致,看看是否解决了问题。 另外,还有一种解决方法是禁用`torch.backends.cudnn.enabled`,这可能会解决这个错误。你可以尝试在代码中添加这一行代码,看看是否有效。 最后,根据你提供的引用,你还可以尝试升级或降级PyTorch的版本,确保与你的CUDA和Python版本兼容。在这个例子中,使用了`pip uninstall torch==1.3.0 pip install torch==1.7.1 cu110 torchvision==0.8.2 cu110 torchaudio==0.7.2`来安装PyTorch 1.7.1版本。 综上所述,解决CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasGemmEx`错误的方法可能包括确认维度是否匹配、统一CUDA设备设置、禁用`torch.backends.cudnn.enabled`或升级/降级PyTorch版本。你可以尝试这些方法来解决问题。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [解决RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cubla...](https://blog.csdn.net/weixin_43519985/article/details/120142199)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* *3* [RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasSgemm 解决方案](https://blog.csdn.net/dream6985/article/details/127320711)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值