深度学习装机配置流程
0.配置列表
序号 | 产品名称 | 品牌、规格型号 | 数量 |
---|---|---|---|
1 | CPU | INTEL i9 7920X | 1 |
2 | CPU散热器 | 美商海盗船H110I | 1 |
3 | 主板 | Asus/华硕 WS X299 SAGE | 1 |
4 | 内存 | 美商海盗船 复仇者LPX DDR4 3000 16GB | 4 |
5 | 固态硬盘 | 三星860 1T | 1 |
6 | 机箱 | 美商海盗船(USCORSAIR) AIR540 | 1 |
7 | 显卡 | 英伟达(NVIDIA)TITAN Xp 显卡 | 4 |
8 | 电源 | EVGA 额定1600w 1600T2电源 | 1 |
1.BIOS设置
在装机过程中,ubuntu16.04 始终安装不上去,常常是莫名其妙的重启以及一些报错。例如报错内容是Error parsing PCC subspaces from PCCT,尝试网上各种解决方法依然无法解决,因此放弃尝试。怀疑问题的原因是主板和系统兼容性的问题,故安装ubuntu18.04系统。
在主板的BIOS关闭快速启动和安全启动。(电脑开机时,按F2进入BIOS设置)
2.系统安装
ubuntu18.04系统是通过U盘启动盘的方式进行安装,具体步骤参考网络资料。安装过程中是选择联网下载更新并且还下载第三方软件(当时是考虑到安装时直接下载更新,可以让系统更好地支持主板)。安装时选择手动分区,分区设置参考如下:
EFI分区:500-1000M
swap分区:8G一级以上和内存同样大小;8G以下分内存两倍
其余全部分给根分区
3.深度学习环境配置
深度学习环境:CUDA9+CUDNN7.4+TensorFlow1.12
整个深度学习环境的配置过程都是直接在图形工作站上直接操作完成。参考文章:https://zhuanlan.zhihu.com/p/50302396 和 https://blog.csdn.net/weixin_41863685/article/details/80303963
3.1安装ssh
安装ssh是为了之后可以远程连接工作站使用。
sudo apt-get install openssh-server
3.2安装显卡驱动
默认安装的显卡驱动不是英伟达的驱动,所以先把旧得驱动删除掉。
sudo apt-get purge nvidia*
添加Graphic Drivers PPA
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
查看合适的驱动版本:
ubuntu-drivers devices
图中可以看出推荐的是最新的415版本的驱动,安装该驱动:(即安装推荐版本的驱动,可能具体的驱动版本不同,请根据实际调整)
sudo apt-get install nvidia-driver-415
安装完毕后重启机器:
sudo reboot
重启完毕运行
nvidia-smi
生效的显卡驱动会有如下的输出:
3.3安装依赖库
sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu