前两天安装一台GPU工作站,P100的GPU的卡,系统是centos7,安装tensorflow-gpu 1.8,网上各种教程各种坑,最后还是自己找方法解决。
1、GPU服务器,Tesla P100
2、centso7.3
3、python3.6
安装前是安装python3.6,tesorflow支持python2.7和3.5比较好,
一、下载CUDA9.0
安装显卡驱动再安装cuda显卡驱动可能会掉,所以先安装cuda,
CUDA官网下载的run包,因为CUDA的run包运行是最简单方便的,比如我的版本为下图1所示,下载【 cuda_9.0.176_384.81_linux.run】
https://developer.nvidia.com/cuda-toolkit-archive
旧版本tensorflow与cuDNN、CUDA的版本关系
二、停用原有显卡
1)把nouveau驱动添加到黑名单
# vim /usr/lib/modprobe.d/dist-blacklist.conf
在很多blacklist下方加入