更新
他妈的,搞了三天,升级了驱动,安装了CUDA12.1, 安装了CUDNN,
结果还是CPU版本。
问题出在清华源上,用conda安装,没找到GPU版本,装成了CPU版本
直接用pip3 安装,一步到位,不用自己装cuda和cudann, pytorch自带了。
pip3 install torch torchvision torchaudio
镜像
有些清华源头已经挂了,但是中文互联网上的一些教程没更新,导致问题
直接看清华源主页设置
-
直接修改文件
vim ~/.condarc
-
将文件写为
channels: - defaults show_channel_urls: true default_channels: - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2 custom_channels: conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud pytorch-lts: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud deepmodeling: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/
-
如果网络有问题,把https改成http
更新驱动
安装CUDA
#安装CUDNN
教程
conda create -n py37 python=3.7
activate py37
conda install tensorflow-gpu=2
conda install pytorch
问题1:
最后一步安装tensorflow不成功
网络挂了
问题1:
发现清华和中科大的源头都挂了
没有细究是和anaconda没谈妥还是超负荷还是怎么滴
解决:
经过换源(清华/北外/中科大)后,发现其实是因为我关闭了ipv6
把所有源删,打开ipv6,速度杠杆的
具体细节没细究 反正是这么解决的
附上源管理命令:(失败可以改成http而不是https)
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
删除所有源:
conda config --remove-key channels
问题2:
Original error was: cannot import name ‘multiarray’ from ‘numpy.core’
解决:
pip uninstall numpy即可
问题3:
torch、tensorflow查看可用gpu个数:
torch.cuda.device_count(),显示0
print(tf.test.gpu_device_name()),
显示RuntimeError: cudaGetDevice() failed. Status: CUDA driver version is insufficient for CUDA untime version
解决:应该需要更新驱动
①首先解决nvidia-smi无法执行:
环境变量中添加 C:\Program Files\NVIDIA Corporation\NVSMI
然后cmd执行:nvidia-smi -L
显示:GPU 0: GeForce GTX 960 (UUID: GPU-e57eb8f5-3421-324f-1f40-fbace950b032)
在https://www.nvidia.cn/Download/index.aspx?lang=cn中寻找对应驱动(发现960没有studio驱动只有game驱动。。没办法了,安装吧)
②再次查看,发现 print(tf.test.gpu_device_name())正常,但是torch.cuda.is_available()显示false:
原因:安装的是cpu版本。需要指定下cuda, 它才会安装gpu版本
卸载pytorch: conda uninstall pytorch
重新安装:
尝试官网方法conda install pytorch torchvision cudatoolkit=10.1 -c pytorch
太慢了
换上清华的源,conda install?
狗日的,明明能上,却显示404
不折腾了,观察,发现需要下载安装这两个版本的东西:我直接去https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/win-64/下载这两个安装包,耗时10秒。
然后本地安装:
首先移动到安装包路径: f:
然后本地安装:
conda install --use-local pytorch-1.5.0-py3.7_cuda101_cudnn7_0.tar.bz2
conda install --use-local pytorch-1.5.0-py3.7_cuda101_cudnn7_0.tar.bz2
成功!
测试torch.cuda.is_available(), 返回True
torch.cuda.device_count(), 返回1
成功了!!
- pip批量导出包含环境中所有组件的requirements.txt文件
pip freeze > requirements.txt
- pip批量安装requirements.txt文件中包含的组件依赖
pip install -r requirements.txt
- conda批量导出包含环境中所有组件的requirements.txt文件
conda list -e > requirements.txt
- conda批量安装requirements.txt文件中包含的组件依赖
conda install --yes --file requirements.txt