在服务器上新建一个conda环境后,遇到了此问题
UserWarning: CUDA initialization: CUDA unknown error - this may be due to an incorrectly set up environment,
e.g. changing env variable CUDA_VISIBLE_DEVICES after program start. Setting the available devices to be zero.
(Triggered internally at /opt/conda/conda-bld/pytorch_1623448255797/work/c10/cuda/CUDAFunctions.cpp:115.)
return torch._C._cuda_getDeviceCount() > 0
首先检查显卡驱动,CUDA,cudnn,以及pytorch的版本是否匹配,如果不匹配,需要卸载之后重装对应的版本。
注意:nvidia-smi命令输出的CUDA Version应该是要求的最高版本,不能高于那个。
其实我的实际原因是服务器出问题了,最终通过重启服务器解决。
参考资料:
1.是否需要配置.bashrc,我本地是直接装了没有配置的,也有网友说要配置,但是多个CUDA时候,就得配置了。这个文件是个隐藏文件,在计的home文件夹下一层,可以vim编辑
# 前三行是安装CUDA的时候需要设置的
export PATH=/usr/local/cuda-11.2/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda-11.2/bin
export CUDA_VISIBLE_DEVICES=0,1,2,3
保存退出,完了source .bashrc一下后生效。
参考:pytorch学习笔记-UserWarning: CUDA initialization: CUDA unknown error - 简书
【Linux】环境变量设置.bashrc及相关_summer的博客-CSDN博客_bashrc
2.查看本地Pytorch是否可用命令
import torch
print(torch.__version__)
print(torch.cuda.is_available())
3.查看Tensorflow是否可调用GPU
import
tensorflow as tf
print
(tf.test.is_gpu_available())
4.
nvcc-V到底是啥?配置多个CUDA
参考Different CUDA versions shown by nvcc and NVIDIA-smi - Stack Overflow
5.Pytorch与CUDA对应版本
Pytorch版本、CUDA版本与显卡驱动版本的对应关系_kelly若的博客-CSDN博客_pytorch和cuda对应版本
6.Tensorflow与CUDA对应版本
7.Pytorch安装Start Locally | PyTorch
当然也有清华镜像的channel, Index of /anaconda/pkgs/main/linux-64/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror
不过还是官方的吧