【踩坑记录】RuntimeError: CUDA error: CUBLAS_STATUS_NOT_INITIALIZED when calling `cublasCreate(handle)

COHREZ

已于 2024-01-28 16:37:36 修改

阅读量7.8k

点赞数 10

文章标签：人工智能机器学习深度学习 pytorch python

于 2024-01-28 16:28:41 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39448884/article/details/135896951

版权

文章讲述了作者在将模型从BERT切换到XLM-Roberta时遇到的问题，涉及CUDA内存溢出、tokenizer不匹配、维度不一致和最终的pad_token_id差异。通过排查和调整，解决了CPU模式下的index溢出问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

从BERT改到XLM-Roberta时，出现该报错，上网查了半天，可能原因如下：

CUDA内存溢出：通过改小batch_size无效；
tokenizer和language model不匹配：经检查代码，发现匹配无误；
维度存在不一致：经检查代码，类别数、隐向量和词向量维度都是正确的；
cuda版本问题：由于是改代码，前面代码未出现该问题，因此不考虑该假设。

后将cuda改为device = 'cpu'模式，发现报错为index溢出，定位错误在tokenizer，经检查发现是BERT和XLM的tokenizer中的pad_token_id是不同的，前者为0，后者为1，改正后，即可运行。

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。