首先,电脑的系统是Ubuntu 16.04硬件是GTX1080Ti,因为要用到GPU加速,所以要装显卡驱动和CUDA。
打算安装的东西和大概步骤按下面的来:
1. Anaconda(最容易装,最先说其实是因为贫僧最先下载好了这个软件的安装包。。。)
2. 显卡驱动
3. CUDA9.1(目前TensorFlow官方不支持9.1版本,所以不想从源码开始编译的话就装9.0版的吧)和CuDNN
4. TensorFlow1.8.0(装在Anaconda创建的虚拟环境里面)
5. PyTorch(这个其实也不难装)
6. Torch7
话说服务器已经配置好了SSH和VNC,这个比较简单就不多说了,网上大把的教程,够用了。
话说回来最好不要想着跑虚拟机里面,因为nVidia大部分的民用卡(Geeforce那些卡,说白了就是不是专业卡的那些显卡,例如贫僧这台服务器的GTX 1080Ti)不支持显卡直通,而且就算支持也不怎么稳定,所以。。。还是让系统跑在物理机上吧。
然后就是如果懒的话还是用CUDA9.0吧,用别人已经编译好了的比较方便,不然还要像贫僧一样自己编译源码来安装。
安装Anaconda
其实比较简单,所以这里随便说一下就行,主要步骤就是从官网下载好对应的linux安装包(.sh后缀的),然后直接跑,一路按回车或输入yes就行了。
选择自己喜欢的版本就行了,贫僧通常都是选python3。。。
Anaconda安装不难,实在不行可以参考后面附上的链接。
通常安装路径按照默认的就行了,如果要给机器上所有用户安装的话就安装在/opt路径下。
显卡驱动
通常的画风是这样的,先从官网手动下载对应自己显卡型号的驱动,然后直接装就行了。
不过要注意的是CUDA对显卡驱动的版本要求:
上传到服务器上面然后再那个文件夹下面直接输入下面的指令运行脚本:
sudo sh NVIDIA*
注意是要运行你刚刚上传上去的脚本,上面这行其实是运行当前目录下NVIDIA开头的脚本,贫僧默认了当前目录里面没有其他NVIDIA开头的脚本(除了刚刚上传的),如果有就要把脚本名字写全一点。
在贫僧的服务器上一路Accept和Yes就行了,不需要额外的设置,但是读者最好先了解一下这些设置的影响,不同系统可能要的设置不一样。
安装完之后直接重启图形界面:
sudo service lightdm start
贫僧一时冲动直接重启整台机器了。。。其实没必要这么干。
启动之后试试nvidia-smi
看看有没有输出显卡信息,有的话就成功了。
安装CUDA9.1
一时冲动就装了这个版本的,其实用CUDA9.0更加方便,可以直接用别人编译好了的tensorflow来安装。
安装依赖包:
sudo apt