安装Ubuntu
- 前段时间安装了18.04.1 ,那时候对于nvidia的20系显卡支持不够友好,即使是下载官方的安装包依然会导致黑屏。所以当新版本可以直接通过更新驱动解决时,我第二时间就开始安装Ubuntu。毕竟在windows上做深度学习真的是很蛋疼,还是linux的架构我更喜欢一些。
- 从官网下载18.04 的Desktop安装包,用软碟通简单烧录到U盘上进行安装。
- 接下来可能需要重新分配硬盘空间。我另外买了一块固态作为Ubuntu的环境,这里采用了主空间和交换空间的方案。虽然超过16G的系统做这个交换空间意义不大,但是我还是设置了16G的SWAP。这里说明一下我的固态是250G的白盘(数据好怕丢失,一定要用网盘备份好数据),32G的内存。具体参考文章如下:
http://tieba.baidu.com/p/5525474552
- 大概就是主空间采用ex4,逻辑/主空间都可,挂载点为 / 。区别在于主空间最多设置4个,其实无所谓的。因为专门为home,root设置空间简直就是脱了裤子放屁,可以安装后自己再设置。SWAP,交换空间,逻辑。当然SWAP可以不设置,设置的话就设置和你内存一样大小就行。我设置了16G,当时忘了自己刚加了一根16G的,晕。
更新驱动
- 刚刚更新不久的18.04,可以直接使用软件更新找到GPU的20系驱动还有我那该死的博通蓝牙wifi网卡,十分方便。当然注意要记得将下载源设置为清华,中科大,阿里什么的。暑假的时候这几个都不好用,不知道是不是因为我运气差。参考如下:
https://blog.csdn.net/github_33678609/article/details/86502916
- 更新完驱动后,在最新的Nvidia包中自带cuda10.1,就不用再下载安装了。具体的可以在终端输入 nvidia-smi查看版本情况。本来想上传图片的,但是截图太大还要压缩,算了,凑合看吧。
- 接下来安装cuDNN还有相关的库什么numpy,keras啥的.PyTorch在官网下载对应版本,具体参考如下:
https://blog.csdn.net/qq_37423198/article/details/89930046
- 说起来,官网安装真的很慢。但是我从20%开始就到10Mb/s了,耐心也很重要。不行的话可以参考网上使用conda修改为清华源安装。
安装pycharm
- jetBrains有学生优惠,可以免费使用professional版本,不用白不用,具体参考如下:
https://blog.csdn.net/qq_15192373/article/details/81091278
升级pip并安装tensorflow2.0
-
首先升级pip版本:
sudo pip3 install --upgrade pip
-
临时修改pip源头:
sudo pip3 install ipython -i http://mirrors.aliyun.com/pypi/simple/
或者-i https://pypi.tuna.tsinghua.edu.cn/simple
-
安装 tensorflow2.0.0
-
sudo pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow-gpu==2.0.0-alpha0
-
安装 Python 和 TensorFlow 软件包依赖项
-
sudo apt install python-dev python-pip # or python3-dev python3-pip
参考自官网,引用如下:https://tensorflow.google.cn/install/source
-
安装 TensorFlow pip 软件包依赖项(如果使用虚拟环境,请省略 --user 参数):
-
pip install -U --user pip six numpy wheel setuptools mock future>=0.17.1
-
pip install -U --user keras_applications==1.0.6 --no-deps
-
pip install -U --user keras_preprocessing==1.0.5 --no-deps
-
sudo pip3 install launchpadlib
-
蛋疼的是,在python中
import tensorflow as tf
出现错误,采用如下解决方法:
GPU版本:sudo pip3 install --upgrade --ignore-installed tensorflow-gpu
-
更新之后,依然出现
cannot import name 'resnet'
-
尝试了诸多方法,都是失败了。我采用重装,先安装推荐的430,然后用命令在中端中删除nvidia驱动,用自己从官网下载的替代,这样省去了自己设置nouveau驱动禁用操作,保证不黑屏。
-
关键来了,此时因为你使用了自己下的驱动,在Ubuntu的软件和更新中有了可以选择的驱动,选择410,下载。完美,终端输入nvidia-smi,推荐cuda版本为10.0
-
更坑的来了,貌似430装cuda10.0也行,不用10.2,真的浪费了很多时间。按照CSDN说法是会自带10.2,实际上并没有安装,醉了。
-
还有一定要按照官方文档来安装,上tensorflow的官网,一步步来,看CSDN上好多废话和假的,根本成功不了!
-
接下来将对应版本的cuDNN下载,并且把文件拷贝到cuda文件夹下,
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
,查看版本为7,成功。另外记得要配置环境变量,用sudo gedit .bashrc编辑输入对应内容(官网教程有)。ncvv -V输出cuda版本说明环境变量配置成功。 -
剩下的和前面一样安装Tensorflow及其依赖,成功后,在python中输入import tensorflow as tf,如下图:
-
另一种测试方法,注意是2.0.0a与以前有差别,参考如下:
https://blog.csdn.net/qq_33440324/article/details/94200046
- 之后本来是安装了 Ananconda 3 的,建议如果依赖包特别多的话,可以选择它。建议下载 2018.5 之前的版本,也就是5.20版本,这样可以省去再安装python3.6的麻烦(之后的版本自带 python 3.7,截止笔者写文章时间,Tensorflow 不支持 3.7 )。但是由于 Anaconda 3 通过 conda install 下载 Tensorflow2.0.0 alpha0 失败(应该是不支持),所以最后还是选择了卸载,直接在 base 下使用 tensorflow。另外本人没有进行大规模的企业级应用开发,自认为根本不需要 Anaconda。如果说国外的能人可以对大部分 AI 代码进行“开发”。那国内一般学校的老师可以达到基本应用,学生基本就是导包。一句广告语送给大家,结束本次的配置:波导手机,垃圾中的战斗机!