ChatGLM3调试出现RuntimeError: CUDA error: CUBLAS_STATUS_INVALID_VALUE when calling `cublasGemmEx( handle

bug全称

RuntimeError: CUDA error: CUBLAS_STATUS_INVALID_VALUE when calling cublasGemmEx( handle, opa, opb, m, n, k, &falpha, a, CUDA_R_16F, lda, b, CUDA_R_16F, ldb, &fbeta, c, CUDA_R_16F, ldc, CUDA_R_32F, CUBLAS_GEMM_DFALT_TENSOR_OP)

问题定位

问题具体定位过程,这里就不过多阐述了,都是通过不断尝试得出的。
简单而言,ChatGLM3的response, history = model.chat(tokenizer, “你好”, history=[])这个语句里面的某个底层语句调用了cublasGemmEx这个函数。
而该函数是一个比较新的函数,在很多cuda版本里面都没有得到很好的支持。

解决办法

我之前使用的是cuda 11.3;pytorch 1.12版本。
升级过后cuda 11.8;pytorch 2.1.0版本。
然后就可以完美适配了。
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
"runtimeerror: cuda error: cublas_status_invalid_value when calling `cublassg` 是在调用 `cublassg` 函数时发生的 CUDA 错误错误代码为 `cublas_status_invalid_value`。这个错误通常是由于输入参数的值无效导致的。 首先,要解决这个错误,我们需要确定导致错误的原因。一种可能性是输入参数超出了有效范围或具有无效的值。另一种可能性是输入参数的大小与函数预期的大小不匹配。 为了解决这个错误,我们可以采取以下步骤: 1. 检查输入参数的值是否满足函数的要求。查看函数文档以确定每个参数的有效值范围,并确保输入满足这些要求。 2. 检查输入参数的大小是否正确。确保输入参数的维度与函数期望的维度匹配。 3. 检查输入参数是否进行了正确的初始化。如果输入参数没有正确初始化,可能会导致无效的值。 另外,检查 CUDA 版本和驱动程序版本是否与函数兼容也很重要。某些 CUDA 函数需要特定的驱动程序版本才能正常工作。 最后,如果以上方法无法解决问题,可以尝试在 CUDA 环境中调试并查找错误的根本原因。使用调试工具来检查内核的执行方式,并查看可能出现错误。 总之,`runtimeerror: cuda error: cublas_status_invalid_value when calling `cublassg` 是一个 CUDA 错误,表示在调用 `cublassg` 函数时发生了值无效的情况。通过检查输入参数的值、大小和初始化情况,以及检查 CUDA 和驱动程序的兼容性,可以解决这个问题。如果问题仍然存在,可以使用调试工具来进一步分析和解决错误。"

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值