近期因为业务需要,需要对一部2017年版的DGX station重新装机,过程有些痛苦,好在已经搞定,现在总结一下大致过程。
安装目标:
1. Ubuntu 18.04 LTS
2. Tensorflow
3. Pytorch
过程:
1. 使用Unetbootin 和官网下载的iso文件,及一个8G的U盘,制作系统盘;
2. 进入bios,关闭掉其他所有的启动系统,仅保留U盘启动;
3. 在Linux系统安装界面,激活ubuntu install,按'e'启动安装管理,在quiet splash之后,添加:acpi_osi=linux nomodeset。而后,ctl+X重启。主要是避免linux安装过程中找不到nVidia显卡驱动。
4. 完全进入系统之后,首先安装显卡驱动: sudo apt install nvidia-driver-418. 这里是根据Telsa V100对应的版本来进行的。
5. 安装anaconda, 官网下载最新版本,而后: bash anaconda3 xxx.sh
6. 建立一个虚拟环境: conda create -n XXX python=X.x
7. 先安装fastai,这里将集成pytorch和cudnn的安装,一个捷径。
conda install -c fastai -c pytorch fastai
8. 安装tensorflow,可以在conda下安装,也可以重新使用virtualenv建立新环境安装tf的环境。