CUDA error: CUBLAS_STATUS_EXECUTION_FAILED 解决方法
最近在训练StructureNet的时候出现了一个错误:
这个错误是在反向传播 backward()
那一步出现的,网上搜了很多相关资料,大部分说法是CUDA
和 PyTorch
版本不匹配造成的,但是换了几个 CUDA
版本还是会出现同样的问题。
最后在GitHub上面看到一个Issue,其中有一个人这样子回复:
看来有可能是 PyTorch
的问题,由于模型比较老,担心新版本会出现其他问题,于是装了一个 PyTorch 1.7
成功运行!
这里还要注意一下 torch-scatter
的问题,我在直接 pip install torch-scatter
的时候出现报错,查了一下发现需要手动安装对应版本的 torch-scatter
(参考:https://blog.csdn.net/dream__1/article/details/122433061)
在 https://pytorch-geometric.com/whl/ 找到对应版本的 torch-scatter
,复制链接, pip install <link>
安装