上周在B站上找了一个深度学习环境的配置,就满心欢喜的去按着教程配置Ubuntu的环境,一个星期不是这出错就是那出错,走进了一个误区,跟学了很久深度学习的实验室的小伙伴交流了之后,他们是复现别人的代码是用conda创建虚拟环境,在虚拟环境中安装相应的环境,既方便又快捷。还有种环境的时候学到了很多隐藏的技能。接下来一一记录一下。
一、cuda的安装
安装这个的目的就是这玩意自带BUFF加成,也就是自带NVIDIA的驱动。先把这个大哥装上就不用管驱动的事了。
话不多说,先把官网祭上https://developer.nvidia.com/cuda-toolkit-archive
这个上面什么版本应该都有,我的感觉是安装一个新一点的 10.2就很可以,就是想把驱动版本带的高一点。
说明:每一个版本下面都有Base installer ,按照这个直接粘贴复制安装即可。(掌握科学上网很重要)
重启之后显卡驱动生效,重启之后输入
下面展示一些 内联代码片
。
nvidia-smi
可以如下图所示。
但是我输入nvcc-V之后没有反应,即是我的环境变量没有添加,可以如下输入
下面展示一些 内联代码片
。
sudo gedit ~/.bashrc //打开环境变量的文件
export PATH="/usr/local/cuda-10.2/bin:$PATH" //具体路径因人而异,就是要把bin添加进去
source ~/.bashrc //刷新一下环境变量文件
然后在输入nvcc -V之后就可以查看当前的版本了
二、anaconda 的安装
在官网下载安装包:https://www.anaconda.com/products/individual
下载529Mb的那个
然后在你下载的目录里打开终端输入以下的命令
下面展示一些 内联代码片
。
chomd +x ./Anaconda3-2020.11-Linux-x86_64.sh //给文件修改可安装权限
./Anaconda3-2020.11-Linux-x86_64.sh //开始安装
然后输入回车键,见到more,按q键,然后输入yes,输入安装位置,即可安装
安装完之后重新打开一个终端,输入以下的命令
conda
which conda
which python
which ipython
which pip
就是看他的工具的指向
三、用anaconda创建虚拟环境复现3D-R2N2
我没有用原作者的代码,而是在github上找了一个用pytorch的代码:https://github.com/heromanba/3D-R2N2-PyTorch
具体的操作都在相关文档中有说明
我说一下我遇到的问题,我先按照文档进行操作,即如下的命令:
git clone https://github.com/heromanba/3D-R2N2-PyTorch.git //下载代码
cd 3D-R2N2-PyTorch //打开文件夹
conda create -n 3D-R2N2 python=3.6 //创建一个名为3D-R2N2的虚拟环境
conda activate 3D-R2N2 //使能环境
pip install -r requirements.txt //安装相关的环境
还有下载一个Download pretrained model(ResidualGRUNet),然后讲这个文件放在新创建的output/ResidualGRUNet/default_model里
这个是连接:
Google drive link(https://drive.google.com/open?id=1LtNhuUQdAeAyIUiuCavofBpjw26Ag6DP)
Baidu pan link(链接: https://pan.baidu.com/s/12YK4mnQNx9xdCjzV7zx7GA 提取码: 66nf)
万世具备,只欠东风。
但是根据他的相关的文件安装后出现一下错误
RuntimeError: cuDNN error: CUDNN_STATUS_NOT_INITIALIZED
查询了之后是版本的问题,具体是谁也不还说,这个时候我看到了他的readme里说了具体的版本
而我才开始默认的是10.2,应该是这里不太对,根据https://blog.csdn.net/matrix273/article/details/103534991?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.control&dist_request_id=&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.control
这个博客的说法,查看了自己可以安装的环境,在pytorch网站上找到了对应的命令行
这个是官网:https://pytorch.org/get-started/previous-versions/
以下是我用到的命令行:
conda install pytorch==1.4.0 torchvision==0.5.0 cudatoolkit=10.1 -c pytorch
然后就搞定了。
这个是他的demo.py 运行的结果
自己复现的第一个系统,记录一下,希望遇到的问题也能给大家一个参考。