一、显卡驱动检查
首先检查系统是否系统是否安装了NVIDIA的驱动,输入 nvidia-smi 查看显卡情况,若不能使用,证明没有安装驱动,此时需要选择对应的驱动即可
安装系统 recommended 版本:
sudo apt install nvidia-driver-470 nvidia-settings nvidia-prime
调整系统的驱动:
选择刚才下载的驱动,点击 "应用更改",然后安装结束重新启动系统
重启后,输入nvidia-smi
二、安装CUDA
这里按照CUDA官网提示的安装步骤正常安装即可
添加系统变量:
在全局环境变量配置文件(/etc/profile)进行配置
- 配置好后:source /etc/profile,随后注销用户以生效
export PATH=/usr/local/cuda-11/bin:$PATH
export PATH=/usr/local/cuda-11/lib64:$PATH
三、安装cuDNN
下载对应版本的压缩包,拷贝文件到指定目录,给予权限就好了
四、训练数据时监测GPU情况
watch -n 1 nvidia-smi
- watch命令可以帮助监测一个命令的运行结果,来定期提示命令运行的结果
- -n: seconds to wait between updates