自己使用是有效的
Pytorch的安装
自己是在实验室的服务器进行实验;
Ubuntu;
3090的显卡;
hmark.pytorch-master$ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2021 NVIDIA Corporation
Built on Thu_Nov_18_09:45:30_PST_2021
Cuda compilation tools, release 11.5, V11.5.119
Build cuda_11.5.r11.5/compiler.30672275_0
自己尝试过pip安装的指令,但是后面遇到了一些问题;
改成了conda install 安装;
特别注意:
自己用的是清华源,如果使用下面代码:(不要这样操作)
conda install pytorch torchvision torchaudio cudatoolkit=11.5
自动安装的版本,竟然是CPU版本的Pytorch,(所以建议不要使用这个方法)
解决方案:
参考链接:[link]
(https://blog.csdn.net/weixin_43868021/article/details/122083729)
参照的是方法3,我直接下载了cu115的相关安装包
清华源torch安装包链接:link
下载好这3个包,到服务器上,进入这3个包所在的文件夹
1. conda install cudatoolkit=11.5
2. conda install --offline pytorch-1.11.0-py3.7_cuda11.5_cudnn8.3.2_0.tar.bz2
3. conda install --offline torchaudio-0.11.0-py37_cu115.tar.bz2
4. conda install --offline torchvision-0.12.0-py37_cu115.tar.bz2
apex问题
参考链接: [link]
(https://blog.csdn.net/m0_37867091/article/details/121429992)
更改指令为:python setup.py install
1. python setup.py install;
mkl问题
在运行apex时候,遇到了这样的报错:
OSError: libmkl_intel_lp64.so: cannot open shared object file: No such file or directory
(可能因为我前面安装合适的pytorch,做了一些错误的安装操作。。。)
参考链接:[link]
(https://blog.csdn.net/weixin_44938178/article/details/109073428)
解决方法:
conda install python=3.7
重新运行下代码:
1. python setup.py install;
最后的编译问题
问题:”subprocess.CalledProcessError“
参考链接: link
方法2是有效的;
修改代码,地址:Scene-Graph-Benchmark.pytorch-master
python setup.py build develop
对应到代码里的修改是:
小检查
参考链接:link
查看pytorch版本、判断CUDA是否可用