在GPU运行报错
RuntimeError: CUDA error: CUBLAS_STATUS_NOT_INITIALIZED when calling `cublasCreate(handle)`
在CPU运行报错
index out of range in self
看了一些回答说batch size太大,或者CUDA版本和torch不匹配,尝试无果。
有可能是embedding的问题
这个答案对我也没效果
最后把网络的各个shape打印出来,发现其实是数据shape不匹配。
有问题先去看数据、embedding、网络维度!!!