关于NVIDIA30系列环境配置问题
问题发现
最近使用新的机器进行深度学习环境配置,按照以往的直接anaconda安装默认pytorch-gpu环境发现不能训练问题,故在此进行记录,希望对各位有帮助。
环境
NVIDIA 3090
症状
在建好的环境中,使用python import torch,成功;
torch.cuda.is_available(),获得true
但是:
print(torch.rand(3,3).cuda())
没有反映,直接卡死,经过多次测试发现,等待大概五六分钟有了输出,再之后执行.cuda()类似操作会比第一次快一点,本以为可能是预热问题,再测试乐观了。
用mnist测试,发现无法进行训练
原因
NVIDIA30系列使用了新架构,只支持cuda11以上版本
解决
去pytorch.org官网,找cuda11版本的conda安装命令,安装该版本,实测解决,可正常训练。
conda install pytorch torchvision torchaudio cudatoolkit=11.0 -c pytorch
其他问题
从pytorch channel安装可能会遇到HTTP问题,网络问题,因为现在国内没有anaconda镜像源可用,只能多试几遍了。
这里分享我安好的环境,可以直接下载解压,放置在env文件夹下就可以正常使用,除了torch只安装了tqdm和pylint,很干净。上传在资源里,可自取。