CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasSgemm(...)

        记录一下我的比较离谱的错误,如果有相同的问题可以参考一下。

        在我训练网络的过程中报了这样的错误:

        在这段报错中,我一开始只是从最后面的报错看错误:

        RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasSgemm( handle, opa, opb, m, n, k, &alpha, a, lda, b, ldb, &beta, c, ldc)`

        我在网络上和GPT上搜索都是说什么版本错误,这个一定要注意,不要觉得版本很容易出现问题,在Debug的时候,版本是最后考虑的事情。

        实际上需要关注的是上面的 t < classes 部分,这个部分表示了网络训练出来的类的数量是小于数据集中的数量的。

        通俗一点就是网络中训练了5类出来,但是数据集中有10类,这导致loss无法计算了。虽然网络训练20类,数据集10类还是可以把训练跑起来的,这样的情况就不能把训练跑起来了。所以只要去修改全连接层的最后汇集的类的数量就可以解决这个问题。

        希望可以帮助到你,我也是有点脑壳抽风所以才会出现这样的问题,如果能对看到的你Debug有帮助我也很开心

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值