Linux-Anaconda虚拟环境 安装配置GPU版本Pytorch 流程+遇到与解决问题小结
- 遇到问题
- 流程总结
- 遇到各种问题、Bug小结
-
- 1.查看cuda版本-nvcc -V、cat /usr/local/cuda/version.txt、nvdia-smi 三种方式得到的都不一样
- 2.多个cuda共存,解决nvcc –V查看的cuda版本不是软链接的cuda对应的
- 3.安装pytorch时候没加pytorch和torchvision版本号,会默认安装torch1.4.0与cuda10.0不匹配!
- 4.RuntimeError("{} is a zip archive (did you mean to use torch.jit.load()?)".format(f.name))
- 5.gpu版本Pytorch执行.cuda()代码会卡死
- 参考帖
遇到问题
最近在用pytorch跑深度学习模型,不过一直用的是CPU,训练速度还是跟不上,正好实验室服务器比较空闲,而且cuda、cudnn也都是配置好了的,所以打算在上面的anaconda虚拟环境中配置一下我想要用的gpu版本的pytorch,配置期间遇到了不少问题,也参考了很多博主的经验,现自己总结记录一下。
流程总结
先说结论,代码可以跑起来了就会发现,事情怎么这么简单(笑哭),但其实是将近一周的折腾才搞好的。因为我只想连服务器的gpu用一下,上面cuda、cudnn都已经配置好了的,我只需要装一个gpu版本的pytorch即可。
1.查看cuda版本
首先查看cuda版本,有很多种查看cuda版本的方法,nvcc -V查看的是Runtime运行时的cuda版本,我这里是10.0:(截图是进入/usr/local文件了,但是其实不必进入)
nvcc -V
PS:如果nvcc -V命令不起作用,可以按照提示sudo安装一下即可
2.查看.bashrc文件,加cuda环境变量
因为现在我是在我自己服务器的账户下配置,所以也需要把自己的conda里面加上cuda环境变量,我一共加了三行。
首先打开.bashrc文件
vim .bashrc 或者 vim ~/.bashrc
翻到文件末尾,按i键可以进行编辑,添加路径:
export LD_LIBRARY_PATH="/usr/local/cuda/lib64:$LD_LIBRARY_PATH"
export PATH="/usr/local/cuda/bin:$PATH"
export CUDA_HOME="/usr/local/cuda:$CUDA_HOME"
最后保存即可,不熟悉Linux命令的可以看下保存方法如下: