【PyTorch报错已解决】CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasSgemm( handle, opa, opb

报错

  • 报错信息为:发生异常: RuntimeError CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling cublasSgemm( handle, opa, opb, m, n, k, &alpha, a, lda, b, ldb, &beta, c, ldc)
    在这里插入图片描述

  • 尝试了但都无效的方法:

    • 在main函数中添加CUDA_LAUNCH_BLOCKING=1
    • 重启环境;
    • 尝试更小的矩阵乘法(排除了显存不够或者内存不够的问题);
    • 替换 @ 、 torch.mm、torch.matmul、torch.einsum等不同的矩阵乘法函数。

有效解决方法

  • 最后的解决方法是:将张量计算转移到cpu上,并进行调试。定位到真实的问题。
	device = torch.device('cuda:1' if not(args.cpu) and torch.cuda.is_available() else 'cpu')
	# 将device换为cpu
    device = torch.device('cpu')
  • 在cpu环境下,重新调试代码,找到真实的报错为发生异常: IndexError index 75880 is out of bounds for dimension 0 with size 75879/。是访问出界问题。
    在这里插入图片描述

  • 解决问题即可。

  • 总结:RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED 这个错误通常表示在调用NVIDIA的CUDA Basic Linear Algebra Subprograms (CUBLAS)库中的函数时出现了问题。具体来说,这里的问题发生在cublasSgemm这个矩阵乘法函数上。但是CUDA的报错信息并没有定位到具体的问题,所以转移到cpu上有助于我们定位问题。

  • 11
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值