查了一下,这个问题应该是因为显卡驱动、cuda版本、torch版本不匹配。但是我朋友在解决这个问题的过程中降级cuda、升级torch都不好使。后来发现这三个版本之间有约束关系,一个对不上都不行。
在conda install torch指定版本的过程中,我发现他会自动给你更新cudatoolkit(到一个可能和你显卡驱动以及你现在安装的torch都不匹配的版本),你还没法拒绝他(在安装过程中好像可以ctrl+c来截断某个安装包的下载,但是我觉得不太正经orz)。我没有尝试单独降级cuda的版本,但我估计他也会自动帮我把torch更新了。所以在这个过程中不能单独改变torch或者cuda的版本,必须同时指定两个版本安装(其实还是对的上就行,只是我用的这个服务器驱动版本比较低,会限制cuda的版本,进而限制torch的版本)。
*如果不是在conda环境中原理也是相同的,直接pip下载对应版本即可(也需要同时指定torch和cuda的版本)
以下是具体的过程:
先康一康一开始的报错
搜了之后发现是显卡驱动、cuda版本、torch版本对不上,我目前的环境是
Driver Version 384.130 # nvidia-smi
cudatoolkit 8.0 # conda list
torch 1.7.1 # conda list</