我的上一篇博客:一文搞定实验室服务器配置:硬件+Ubuntu+CUDA/cuDNN+Python/Anaconda深度学习环境配置. 今天拿一台游戏本重现了这个过程(神舟Z7-CT5NA),写篇博客记录一下。
这台笔记本的显卡是1660Ti(所以不差于1660Ti的机器可以照搬经验)
这台笔记本的CPU是带核显的Intel(不带核显的Intel应该也可以,但是AMD的CPU不知道行不行)
安装Ubuntu 18.04 LTS桌面版
下载镜像,rufus做启动U盘,从U盘启动,一路yes到分区
选择自定义分区(一定不能选别的),按照网上的分区方案做好分区
我的分区方案(250G磁盘空间):根目录/30G(最小不要小于15G),swap16G(和内存大小一致),/boot4G(最小不要小于256M),其余给/home
搞好分区之后选择boot device. 如果双系统的话,选择/boot对应的分区;如果单Linux的话,选择根目录分区所在的磁盘
这一步搞好之后应该又可以一路yes了,按照要求做
安装后续工作
换软件源,sudo apt update
,sudo apt upgrade
,sudo apt install build-essential
安装gcc:sudo apt install gcc
(我们这次gcc的版本是7.5.0)
安装NVIDIA显卡驱动
(安装显卡驱动和安装CUDA的这两步是完全按照原来的博客来的,但是其实不需要提前安显卡驱动,在安装CUDA的时候一起安就行了)
看看自己的设备:lspci | grep -i nvidia
chong@chong-NH5x-7xEDx-RCx-RDx:~$ lspci | grep -i nvidia
01:00.0 VGA compatible controller: NVIDIA Corporation Device 2191 (rev a1)
01:00.1 Audio device: NVIDIA Corporation Device 1aeb (rev a1)
01:00.2 USB controller: NVIDIA Corporation Device 1aec (rev a1)
01:00.3 Serial bus controller [0c80]: NVIDIA Corporation Device 1aed (rev a1)
这里驱动还没安好,看不到显卡具体型号,在设置-设备
里面也只能看到设备的核显。
看看推荐安装的驱动版本:ubuntu-drivers devices
chong@chong-NH5x-7xEDx-RCx-RDx:~/Downloads$ ubuntu-drivers devices
== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
modalias : pci:v000010DEd00002191sv00001558sd00008550bc03sc00i00
vendor : NVIDIA Corporation
driver : nvidia-driver-418-server - distro non-free
driver : nvidia-driver-440-server - distro non-free recommended
driver : nvidia-driver-435 - distro non-free
driver : nvidia-driver-440 - distro non-free
driver : xserver-xorg-video-nouveau - distro free builtin
== /sys/devices/pci0000:00/0000:00:14.3 ==
modalias : pci:v00008086d0000A370sv00008086sd000002A4bc02sc80i00
vendor : Intel Corporation
manual_install: True
driver : backport-iwlwifi-dkms - distro free
用sudo ubuntu-drivers autoinstall
安装所有推荐的驱动(确保已经upgrade
到最新)
然后重启一下就可以
安装CUDA
刚才ubuntu-drivers devices
推荐的驱动版本是440,通过autoinstall
已经装上了,所以我们去看看这个驱动版本对应的CUDA版本:看这里
根据这个表格得知,我这台安装10.1应该没问题,所以准备安装CUDA 10.1.
在这里找到安装包(10.1 update2),按照本机硬件、系统进行选项,并选择通过脚本安装,得到了两条指令:
wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.243_418.87.00_linux.run
sudo sh cuda_10.1.243_418.87.00_linux.run
无非就是下载脚本然后带权限运行。我们照做即可。
因为之前已经装过驱动,所以他弹出来一个界面建议我们abort,这里不管,直接continue就可以。
然后之后他会询问我们要安装的东西,除了驱动不安之外其他都安装。
安装完成后,需要重启一下,然后根据原文做测试,能通过就是成功。
安装cudnn
cudnn和CUDA配合的版本就只有一个7.6.5,下载安装就可以。
这回我们换个思路,通过deb方式安装,因为这样我们就可以用官方方法验证了。
在这里下载所需的三个deb,分别是cuDNN Runtime Library for Ubuntu18.04 (Deb),cuDNN Developer Library for Ubuntu18.04 (Deb),cuDNN Code Samples and User Guide for Ubuntu18.04 (Deb)
安装之后用它提供的程序做验证,成功验证通过
安装pytorch
官网安装即可