最近一个项目需要在TITAN RTX 2080Ti 上安装Ubuntu18.04+Nvidia-430显卡驱动+Cuda10.1+Cudnn+7.6+Anaconda3+深度学习环境(tensorflow1.14.0+keras2.2.4+torch1.1.0),这里记录安装的对应版本和运行过程中的坑。
主要分为两部分:
- 安装ubuntu18.04系统和显卡驱动 (1)
- 安装深度学习环境,以及环境的复制和迁移,见下篇文章 (2)
一、安装ubuntu18.04
电脑在安装前已有windows10系统,这里针对Titan RTX 2080Ti 安装ubuntu18.04 双系统。
一、电脑磁盘分区
给电脑分出一块空间来装ubuntu 系统, 在windows装在固态硬盘里的前提下,最好将ubuntu装在机械硬盘中,若将两个系统都装在固态硬盘下,容易开机找不到启动项,无法进入ubuntu界面。
- 鼠标右键计算机,选择管理,在弹出来的窗口左侧点击 存储/磁盘管理,进入磁盘管理界面,如下图所示:
- 在你要安装的目标磁盘中,右键选择压缩卷,输入压缩空间量(具体大小可根据实际情况确定,一般不要低于100G,磁盘空间够大可适当多分一些)。也可以通过删除卷和删除分区操作腾出一块未分配的磁盘空间做为安装区。
这里我给自己的电脑分配了200G的空间,点击”压缩”后,会在磁盘上多出一块200G的未分配区。分区完成。
二、安装ubuntu18.04系统
1、设置启动项
重启计算机,在重启前插入ubuntu系统启动U盘,在开机界面按F12进入到设置界面(有的电脑是按F2,开机时会有提示),选择Boot Menu, 进入 Boot Manager后,选择最后一项UEFI :SanDisk作为启动项,进入安装程序,选择install ubuntu ,回车安装。
(由于我的电脑之前安装好了ubuntu,所以前边有ubuntu系统的引导项,在开机时,选择第二项或第三项ubuntu可以直接进入ubuntu系统)
2 开始安装
-
选择语言:中文简体
-
选择键盘布局:汉语
-
更新选项:选择正常安装。
-
安装类型:选择 其他选项 (手动分区)
-
手动分区设置 (重点!!)
在第一步中,我们通过压缩卷在磁盘1上给Ubuntu18.04预留了200GB的未分配磁盘空间,对应于下图的200G左右的空闲区
分区设置:
最基本的四个分区: 挂载点 /; 挂载点 /boot;挂载点 /home; 以及交换空间swap;
分区大小建议:
/. 主分区: 用于存放系统,相当于windows的C盘 一般给30G
/boot:引导分区,为主分区,2G
交换空间 swap:相当于电脑内存,逻辑分区,大小设置与显存的大小有关,例如我是24G显卡,则分配 24G
(如果内存小,就分配 2~3 倍内存的空间;
如果内存中等,就分配 1~2 倍内存的空间;
如果内存大,就分配 1 倍内存的空间)
/home: 用于用户存储数据,逻辑分区,要尽可能大,可将剩余的空闲区全部给/home,>100G
其他有 挂载点 /tmp; 挂载点 /usr; 挂载点 /var,均为逻辑分区,在这里可以不用划分;
选中之前预留的空闲区,点击左下角“+”按钮,依次按照上边的分区原则进行分区:
在分区完成之后,在以下界面,后边类型为etx4标注的即为刚刚划分出的ubuntu区。选择最下边“安装启动引导器的设备”,这里要选择boot对应的分区 !!!若选成别的则启动不了!然后点击右下角“现在安装”,会弹出来对话框让检查分区,确认无误后选择“继续”,
-
选择时区: shanghai 即可
-
创建用户名和密码:
这里要记住密码。因为每次启动和使用sudo命令时都要输入。
设置完成后,选择“继续”,等待安装 -
安装必要的软件
此时会安装一些必要的软件,能正确安装的情况下,这个部分很快,且不会报错。如果不能成功安装,这里会爆出错误,提示安装失败。
正常情况下是下图,然后重启就可以:
如果不正常,最常见的一个错误是 GRUB安装失败。这就是说明在分区的时候不能设置/boot,而要将“/boot”换成“EFI系统分区”
具体做法是:从步骤1开始重新安装一遍,在步骤5时,先点击左下角的‘-’将所有的ext4分区和swap删除,然后再重新创建分区,将四个分区中的“/boot”替换成“EFI系统分区”,大小不变,其余的不变,启动引导项选为 efi 类型的设备,然后继续。
9. 开机后就会看到ubuntu系统启动的引导菜单,选择*ubuntu可进入ubuntu系统。如果看不到引导菜单,直接默认进入windows系统,说明启动引导项的顺序不对,可按F12键从设置界面中进入。
三、 安装NVIDIA显卡驱动
通常在这种新显卡上装系统,会因为没有对应的新版本的驱动而分辨率不正常,这时需要手动安装显卡驱动。
1. 在安装完成ubuntu后,需要更新所有的包
sudo apt-get update
sudo apt-get upgrade
最好也更新一下gcc:
sudo apt install gcc
2. 安装驱动:
sudo apt-get remove --purge nvidia* #卸载原有的nvidia驱动
sudo gedit /etc/modprobe.d/blacklist.conf #用gedit打开文本
#在打开黑名单的最后加上两行:
blacklist nouveau
options nouveau modeset=0
保存关闭
继续在终端输入:
sudo update-initramfs -u
lsmod | grep nouveau
上句命令结束后没有输出即操作成功,如果有输出可重启再次查看
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-driver-430 #也可以改成自己需要的版本
再次重启电脑,在终端输入
nvidia-smi
若输出显卡信息列表,则表明驱动成功安装,此时桌面的显示分辨率也变的正常。
若无输出,或者提示找不到命令,则驱动没有安装成功。