我用的版本配置:
Tensorflow-GPU==1.15.0+db2 Keras-GPU==2.2.4
通过一下命令查询 可以安装的tensorflow-gpu 的版本及资源路径
使用conda 查询可安装包
按照路径进行安装对应的安装包,这样比不写路径装速度更快,并且可以查到。
详细查询
进行安装
conda install --channel https://conda.anaconda.org/Databricks/tensorflow-gpu=1.15.0+db2
目前还在看怎么使用GPU进行训练模型。
其实使用conda 安装Tensorflow-GPU的时候已经自动安装了cudatoolkit 以及 cudnn
我还不知道怎么用。
下面我说一下显卡的驱动安装 亲测的成功过程
1.首先
查询自己显卡对应的驱动版本: https://www.nvidia.com/Download/index.aspx?lang=en-us
2. 下载 .run 文件
3. 卸载原先所有跟nvidia相关的所有驱动
#for case1: original driver installed by apt-get:
sudo apt-get remove --purge nvidia*
#for case2: original driver installed by runfile:
sudo chmod +x *.run
sudo ./NVIDIA-Linux-x86_64-440.36.run --uninstall
4. 禁用nouveau:
sudo gedit /etc/modprobe.d/blacklist.conf
在最后一行加入
blacklist nouveau
之后执行
sudo update-initramfs -u
电脑重启之后执行
lsmod | grep nouveau #没有输出,即说明安装成功
注: 之后安装可能出现 pre-install script failed 错误, 我说明一下,只要你正常按照操作流程,去除了驱动,就没问题,这是nvidia 工程师开的玩笑,目的是确认你真是要按照这个 哈哈。
5. 下面进行安装驱动
首要要进入命令行模式,这里我建议再用一个电脑,或手机来查看教程。
Ctrl-Alt+F1,之后输入用户名和密码登录即可。 (Alt + F7 又可以回到桌面)
给驱动run文件赋予执行权限:
cd Downloads
sudo chmod a+x NVIDIA-Linux-x86_64-440.36.run
安装:
sudo ./NVIDIA-Linux-x86_64-440.36.run –no-opengl-files
这里可能会出现 Error: You appear to be running an X server; please exit X before.......
解决办法:
Ctrl-Alt+F2
切换到根权限:
su - root
输入 init 3 进入文本模式, 这样就关闭了一切图形界面
然后再执行上面说的安装命令。
过程就下面这样
6. 重启电脑 挂载驱动 验证
reboot 命令 重启电脑
挂载驱动
modprobe nvidia
验证
nvidia-smi
完成。