RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasSgemm 解决方案

解决PyTorch运行时出现的CUDA CUBLAS_STATUS_EXECUTION_FAILED错误。通过调整PyTorch、CUDA和Python版本匹配,最终成功运行模型测试代码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

问题描述

解决方案

后记


问题描述

跑pytorch相关的代码时,在根据requirements.txt进行环境配置后,运行模型测试代码,出现了以下错误

  File "/opt/conda/envs/uof/lib/python3.7/site-packages/torch/nn/modules/module.py", line 541, in __call__
    result = self.forward(*input, **kwargs)
  File "/opt/conda/envs/uof/lib/python3.7/site-packages/torch/nn/modules/linear.py", line 87, in forward
    return F.linear(input, self.weight, self.bias)
  File "/opt/conda/envs/uof/lib/python3.7/site-packages/torch/nn/functional.py", line 1372, in linear
    output = input.matmul(weight.t())
RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasSgemm( handle, opa, opb, m, n, k, &alpha, a, lda, b, ldb, &beta, c, ldc)`

在网上查询这个问题的解决方案千奇百怪,尝试之后都没有成功解决。

解决方案

后来猜想应当是pytorch、cuda和python版本不匹配的问题(之前遇到过一次python版本为3.8过高装不上低版本pytorch~=1.3.0的情况),去查找了cuda、pytorch和python之间的版本对应关系表:

https://blog.csdn.net/weixin_45564943/article/details/121688734

 

根据目前的cuda版本(11.2),python版本(3.7),选择了安装pytorch~=1.7.0版本:

pip uninstall torch==1.3.0
pip install torch==1.7.1+cu110 torchvision==0.8.2+cu110 torchaudio==0.7.2 -f https://download.pytorch.org/whl/torch_stable.html

 成功解决了该问题

后记

下次再安装pytorch时,一定要考虑python和cuda版本再做选择,不要盲目依赖requirements.txt。

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值