RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasSgemm 解决方案

行业边缘的摸鱼怪

已于 2023-03-27 10:48:09 修改

阅读量2.2w

点赞数 11

分类专栏： bug解决方案文章标签： pytorch python 深度学习

于 2022-10-14 15:08:46 首次发布

本文链接：https://blog.csdn.net/dream6985/article/details/127320711

版权

bug解决方案专栏收录该内容

66 篇文章

订阅专栏

解决PyTorch运行时出现的CUDA CUBLAS_STATUS_EXECUTION_FAILED错误。通过调整PyTorch、CUDA和Python版本匹配，最终成功运行模型测试代码。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

问题描述

跑pytorch相关的代码时，在根据requirements.txt进行环境配置后，运行模型测试代码，出现了以下错误

File "/opt/conda/envs/uof/lib/python3.7/site-packages/torch/nn/modules/module.py", line 541, in __call__
result = self.forward(*input, **kwargs)
File "/opt/conda/envs/uof/lib/python3.7/site-packages/torch/nn/modules/linear.py", line 87, in forward
return F.linear(input, self.weight, self.bias)
File "/opt/conda/envs/uof/lib/python3.7/site-packages/torch/nn/functional.py", line 1372, in linear
output = input.matmul(weight.t())
RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasSgemm( handle, opa, opb, m, n, k, &alpha, a, lda, b, ldb, &beta, c, ldc)`

在网上查询这个问题的解决方案千奇百怪，尝试之后都没有成功解决。

解决方案

后来猜想应当是pytorch、cuda和python版本不匹配的问题（之前遇到过一次python版本为3.8过高装不上低版本pytorch~=1.3.0的情况），去查找了cuda、pytorch和python之间的版本对应关系表：

https://blog.csdn.net/weixin_45564943/article/details/121688734

根据目前的cuda版本（11.2），python版本（3.7），选择了安装pytorch~=1.7.0版本：

pip uninstall torch==1.3.0
pip install torch==1.7.1+cu110 torchvision==0.8.2+cu110 torchaudio==0.7.2 -f https://download.pytorch.org/whl/torch_stable.html

成功解决了该问题