@服务器linux相关命令
问题1:RuntimeError: CUDA error: out of memory
方法:
nvidia-smi (查看服务器中程序的运行占用内存状态)
kill -9 进程号 (杀死无关进程释放内存)
问题2:Pytorch错误:Torch not compiled with CUDA enabled
方法:
控制态终端输入:python,
>>>import torch,
>>>torch.cuda.is_available(),
如果返回False则说明torch未安装至GPU上。
nvidia-smi查看cuda版本。
我的版本是11.2的,创建新的虚拟环境conda create -n 环境名。
然后使用命令:conda install pytorch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2 cudatoolkit=11.0
问题:RuntimeError: cuDNN error: CUDNN_STATUS_ALLOC_FAILED
原因:cuDNN 是 NVIDIA 打造的针对深度神经网络的加速库,是一个用于深层神经网络的 GPU 加速库。如果你要用 GPU 训练模型,cuDNN 不是必须的,但是一般会采用这个加速库。
方法:torch.backends.cudnn.enabled = False