最近配置一个深度学习的服务器,折腾了大半天,每次弄的时候都得去网上找,于是乎想自己记录一下,方便以后再次使用,由于使在网上找了好多个教程而且每个教程的方法都不一样,最开始弄的自己稀里糊涂的,不过后来只跟着其中两个教程就好了,还有一个就是我没有安装CUDNN就能够调用GPU,我不知道这是什么原因,先给自己挖个坑,如果以后找到原因了或者是不安装CUDNN不能进行深度学习的话就过来填坑
以我自己为例,省略前面购买和ssh连接的过程,实例是Ubuntu 18.04 + GPU Telsa T4
安装的是CUDA11.7.1和pytorch1.12.1
GPU驱动安装
方法一
在英伟达驱动下载页面设置自己的配置,之后点击“SEARCH”,之后点击“DOWNLOAD”,再然后,右键“AGREE$DOWNLOAD”,复制链接地址
返回服务器命令行,输入wget 地址
此处是
wget https://us.download.nvidia.com/tesla/515.65.01/NVIDIA-Linux-x86_64-515.65.01.run
下载完成后,执行以下代码安装驱动
sudo chmod a+x NVIDIA-Linux-x86_64-515.65.01.run
sudo ./NVIDAI-Linux-x86_64-515.65.01.run -no-nouveau-x-check -no-opengl-files
注意:这里的版本一定要一致,即我这里的示例是 515.65.01
方法二
直接执行以下命令(前提是你要知道安装的驱动版本是适合你的服务器内核版本的)
sudo