pytorch环境配置

最新推荐文章于 2024-08-08 08:17:30 发布

VoidShooter26

最新推荐文章于 2024-08-08 08:17:30 发布

阅读量6.4k

点赞数 3

分类专栏：机器学习

本文链接：https://blog.csdn.net/weixin_40910202/article/details/80794433

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

由于在windows下环境配置问题比较多，尝试了在Linux下配置，记录一下。

一、基础环境

1. Linux（Ubuntu16.04）

计划安装在一个移动固态硬盘上，因此采用虚拟机的安装方式，安装时注意设置以下几点：

1）为了兼容原电脑的boot方式，选择uefi。

2）在vmware中设置系统在整个磁盘

3）并且保留对硬盘的操作，否则无法在linux系统中访问硬盘。

首次登录系统后，选择镜像源更新软件包。

<strong>sudo apt-get update
sudo apt-get upgrade
sudo reboot</strong>

2. Cuda+Cudnn

走了两天的弯路告诉我，一定要先安装CUDA。因为Linux上NVIDIA驱动兼容性很差，很容易遇到无限登录问题。尝试了很多方法，最后采用以下的方式。

理论上CUDA中包含显示驱动，只需安装CUDA不需要再单独安装驱动。但是由于未知原因我安装的CUDA启动以后总是无法识别驱动，所以我先安装了NVIDIA驱动，后安装CUDA。

2.1 显卡驱动（可选）

2.1.1下载驱动

首先登陆NVIDIA官网下载对应型号的驱动。https://www.nvidia.com/Download/index.aspx dab格式bug很多，下载run格式

可使用命令查看硬件型号

<strong>sudo lshw -numeric -C display</strong>

使用命令查看推荐安装的驱动版本

<strong>ubuntu-drivers devices</strong>

2.1.2 屏蔽开源驱动nouveau

因为安装的时候NVIDIA驱动会自动停止其他驱动，保险起见加入黑名单。

打开黑名单

<strong>sudo gedit /etc/modprobe.d/blacklist.conf</strong>

添加以下内容

<strong>blacklist nouveau
blacklist vga16fb
blacklist rivafb
blacklist nvidiafb
blacklist rivatv</strong>

添加完以后输入更新内核设置后重启

<strong>sudo update-initramfs –u</strong>

重启后显示字体会变大，这是禁用显卡驱动后的正常现象，不放心可以输入一下命令检查是否禁用成功

<strong>lsmod | grep nouveau</strong>

重启后如果字体没有变大，可以尝试强制删除

<strong>mv /lib/modules/4.13.0-45-generic/kernel/drivers/gpu/drm/nouveau/nouveau.ko /lib/modules/4.13.0-45-generic/kernel/drivers/gpu/drm/nouveau/nouveau.ko.org
update-initramfs -u</strong>

2.1.3 删除残留驱动（可选）

用于安装失败卸载重新安装

<strong>sudo apt-get remove --purge nvidia*</strong>

2.1.4 安装dkms包

如果不安装dkms包，安装过程中可能会报错：unable to locate the kernal sourse

输入命令安装

<strong>sudo apt install dkms</strong>

2.1.5 安装驱动

按Ctrl+Alt+F1进入控制台，先输入用户名和密码

驱动管理休眠

<strong>sudo service lightdm stop</strong>

cd到显卡驱动目录，执行

<strong>sudo bash NVIDIA*.run</strong>

接着按照提示进行安装，需要注意的是：安装过程中报错The distribution-provided pre-install script failed不用管继续安装。注意openl一定不要安装(除非双显卡)，否则还是会出现无限登陆问题。其他按照提示选择，提示是否使用nvidia 的xconfig要选择替换，直至最终安装完成后唤醒驱动管理

<strong>sudo service lightdm start</strong>

2.1.6 重新启动

安装完成后输入命令重新启动系统

<strong>sudo reboot</strong>

重新启动后可以看到NVIDIA驱动已经安装完成（大多数人是这样）。笔者登陆时依然有循环登陆的问题，查阅了很多资料，试了很多，最终发现是UFEI安全模式导致的，所以如果系统的引导模式是UFEI可以尝试关掉安全模式。

安装完成后，可运行以下命令查看安装情况

<strong>sudo apt install mesa-utils
glxinfo|grep rendering
nvidia-smi </strong>

2.2 CUDA

2.2.1 安装CUDA

有了安装NVIDIA驱动的经验，安装CUDA就不难。

Cuda Toolkit 安装地址为：https://developer.nvidia.com/cuda-downloads 同样下载 .run格式的。

与安装NVIDIA驱动相似，需要在管理驱动休眠的状态下安装。

2.2.2 安装第三方库

安装过程中，注意到提示缺少几个第三方库，按照说明文件（https://docs.nvidia.com/cuda/）进行安装。

<strong>sudo apt-get install g++ freeglut3-dev build-essential libx11-dev \
    libxmu-dev libxi-dev libglu1-mesa libglu1-mesa-dev</strong>

2.2.3 设置环境变量

如果没有安装vim包需要输入以下命令

<strong>sudo apt-get install vim</strong>

如果提示vim 依赖vim-common 可以先卸载vim-common再安装

<strong>sudo apt-get remove vim-common</strong>

打开环境变量配置文件

<strong>sudo vim  ~/.bashrc</strong>

按i键移动到末尾出增加以下两行

<strong>export PATH=/usr/local/cuda-9.1/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.1/lib64:$LD_LIBRARY_PATH</strong>

按ESC键盘输入 :wq 保存退出

运行以下命令更新环境变量

<strong>source ~/.bashrc</strong>

完成后输入命令测试安装情况

<strong>nvcc --version</strong>

出现以下提示说明安装成功

测试cuda的Samples

<strong>cd /usr/local/cuda-9.1/samples/1_Utilities/deviceQuery
sudo make
sudo ./deviceQuery</strong>

得到以下结果证明cuda安装成功

2.3 cuDNN

登录网站下载对应版本的cuDNN，需要登录NVIDIA帐号。https://developer.nvidia.com/rdp/cudnn-archive

下载完成后打开下载地址终端，运行以下命令安装

<strong>sudo dpkg -i libcudnn7_7.0.5.15-1+cuda9.1_amd64.deb
sudo dpkg -i libcudnn7-dev_7.0.5.15-1+cuda9.1_amd64.deb
sudo dpkg -i libcudnn7-doc_7.0.5.15-1+cuda9.1_amd64.deb</strong>

安装完成后输入以下命令测试cuDNN

<strong>cp -r /usr/src/cudnn_samples_v7/ $HOME
cd $HOME/cudnn_samples_v7/mnistCUDNN
make clean && make
./mnistCUDNN</strong>

得到以下结果，证明cuDNN安装成功

3. Anaconda

登录https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/镜像选择合适的下载版本进行下载

下载后运行命令安装

<strong>sudo sh Anaconda*.sh</strong>

4. PyCharm

采用PyCharm专业版，学生可免费申请官方网址：https://www.jetbrains.com/pycharm/

下载后将文件放到需要安装的目录（建议放在home下），运行以下命令进行解压

<strong>sudo tar -xzf pycharm-professional-2018.1.4.tar.gz</strong>

解压后即可删除压缩包文件，然后进入bin文件夹使用sh命令运行PyCharm

<strong>sudo sh pycharm.sh</strong>

5. Python环境

5.1 镜像源加速

<strong>conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes</strong>

5.2 建立基础python环境

<strong>conda create -n base_env python=3.6
source activate base_env
conda install numpy
conda install opencv
conda install matplotlib
conda install scipy
conda install pandas</strong>

5.3 clone出使用的环境

clone出用于安装pytorch和tensorflow的env并激活环境

<strong>conda create -n tensorflow --clone base_env
source activate tensorflow</strong>

5.4 Pytorch

进入PyTorch官网（https://pytorch.org/）选择对应的版本并按照提示命令输入到命令符中，选择Linux+conda+3.6+9.1时需要输入以下命令

<strong>conda install pytorch torchvision cuda91 -c pytorch</strong>

5.5 TensorFlow

许多项目会用到TensorFlow的库，也一并装上，官网地址：https://www.tensorflow.org/ 根据安装需求查找安装的命令，在Linux+Anaconda+gpu需要输入以下命令

<strong>pip install --ignore-installed --upgrade https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-1.6.0-cp36-cp36m-linux_x86_64.whl</strong>