ubuntu下配置深度学习环境很容易出错,网上一搜有五花八门的教程。有些认为直接在安装cuda的时候顺便装驱动,有些则是先自己安装好驱动,然后在装cuda的时候就不再安装驱动了。
我选择了后者,这似乎是一个更多人认可的方法。而对于后面需要安装多cuda版本的情况下,这样做也更科学。教程的话,网上已有的太多了,但是靠不靠谱另说。在这里我通过自己的安装过程来记录一个可靠的安装方法。主要的安装教程在此。
我基本上是按照这个教程一步步来的,只不过中途遇到了一些小问题。在此,具体安装过程我就不再详述了,只记录一下我在安装过程中遇到的问题以及解决办法。我的ubuntu系统是20.04版本的,但是为了可以使用TensorFlow,就没有安装最新版的cuda11.2。在选择cuda版本时候,直接选择18.04系统的就可以了。在安装过程中不要只顾着复制教程的命令行,要注意自己下载的各个安装包版本号并对应更改,才不会出现找不到命令的情况。
- 问题一:在关闭图形界面的时候,执行命令
sudo service lightdm stop
之后,没有直接跳到命令行界面,整个界面都是黑色的,顶部只有一行/dev/sad8: clean, 690505/44138496 files, 27434882/176542976 blocks
。 - 解决办法:按快捷键ctrl+alt+F1,会让你输入ubuntu的账号和密码,成功后就可以进入命令行界面了。但是这里会遇到一个问题,账号密码都没错,但是登陆时候总是显示incorrect。这是因为你是用右侧小键盘输入的数字,而这里输入的数字无法被正确识别,解决办法就是通过键盘上方的那一行数字键盘来输入数字。参考https://blog.csdn.net/yz930618/article/details/77584680。
- 问题二:在进入命令行界面安装cuda的时候,如果输入的是
sudo ./cuda_10.0.130_410.48_linux.run
,会出现乱码,输入密码后也一样,且并没有进入安装程序。 - 解决办法:在sudo之后添加sh,也即
sudo sh cuda_10.0.130_410.48_linux.run
,然后输入密码,就可以正确运行安装文件了。 - 关于cudnn下载哪个文件的说明。在选好cudnn版本之后,会下拉出很多个文件,如下所示。选择cuDNN Library for Linux即可。
- 最后,在此记录一下ubuntu系统关机重启的快捷键:ctrl+alt+delete。