anaconda pytorch_CUDA + Anaconda + PyTorch 安装

08b8e8cdec757733e815ce5e9f0db5b5.png

在配置好 Linux 环境并顺利装上 RTX2060 的显卡驱动后(见上一篇),接下来就是安装 CUDA 和 PyTorch 了。

打开英伟达官方网页,按照相关的环境下载合适的文件,我基本上用的都是 runfile,因此这次也不例外,如下图

0806032287cd6a674b44b101969e5c1f.png

按照提示在 terminal 中输入以下命令下载 runfile 文件,

$ wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.243_418.87.00_linux.run

然后用

$ sudo sh cuda_10.1.243_418.87.00_linux.run

进行安装。在安装过程中,它会检查你的驱动程序,并建议你重装驱动。但是不用理它,选择 continue 继续,在选择接受一些条款后会出现可选择的安装组件,第一个选项即为驱动程序,因为我记得看到的驱动程序是 410 版本,比我安装的 430 低,所以我选择不勾选它,而是直接安装其他全部 CUDA 的 tools 与 libaray。

安装完成后由如下提示

Please make sure that
 -   PATH includes /usr/local/cuda-10.1/bin
 -   LD_LIBRARY_PATH includes /usr/local/cuda-10.1/lib64, or, add /usr/local/cuda-10.1/lib64 to /etc/ld.so.conf and run ldconfig as root
To uninstall the CUDA Toolkit, run cuda-uninstaller in /usr/local/cuda-10.1/bin
Please see CUDA_Installation_Guide_Linux.pdf in /usr/local/cuda-10.1/doc/pdf for detailed information on setting up CUDA.
***WARNING: Incomplete installation! This installation did not install the CUDA Driver. A driver of version at least 418.00 is required for CUDA 10.1 functionality to work.
To install the driver using this installer, run the following command, replacing <CudaInstaller> with the name of this run file:
    sudo <CudaInstaller>.run --silent --driver
Logfile is /var/log/cuda-installer.log

WARNING 部分不用管,我们的驱动 430 比 418 更高。比较重要的是 PATH 和 LD_LIBRARY_PATH 的设定。

参考官方文档,我在 .bashrc 末尾加上了如下代码(虽然可能不太好,but it works)

$ export PATH=/usr/local/cuda-10.1/bin:/usr/local/cuda-10.1/nsight-compute-2019.4.0${PATH:+:${PATH}}

和官方参考有些差别,这要看在 /usr/local/ 下实际安装的文件。

对于 LD_LIBRARY_PATH 的设定,我则考虑使用了 ldconfig,具体如下,在 /etc/ld.so.conf.d/cuda-10-1.conf 文件中添加一行

/usr/local/cuda-10.1/lib64

然后使用命令 sudo ldconfig 使之生效。

为了确认一切准备就绪,我重启计算机后先简单用 which nvcc 确认相关 tools 被装上,然后在 Nvidia 官方给的 NVIDIA_CUDA-10.1_Samples 文件夹中用 make 命令生成可执行文件。可执行文件在 ./bin/x86_64/linux/release 文件夹下。我们试着运行几个文件看看,常规的,首先测试 ./deviceQuery,结果如下,

917bf5a422803e59317855b1b44cdb99.png

一切看起来似乎都不错,我们也可以继续测试一些其他的例子。不过对于我来说最重要的是配置 PyTorch 的 GPU 版本。


我先去 Miniconda 下载了最新版的 Miniconda Linux 64-bit,然后创建一个专门用于 PyTorch 的环境,

conda create -n pytorch-env

按照提示用 conda activate pytorch-env 激活该环境,再接下去就是按照 pytorch 的官方提示选择合适的配置环境,如下图

a6b9409558fd6f997fc4e3ce6470ef1d.png

利用命令 conda install pytorch torchvision cudatoolkit=10.1 -c pytorch 完成安装。


最后测试 PyTorch 的 GPU 版是否可用,我使用了经典的 mnist 来做这个测试。我去到 pytorch 的 Github 例子页,下载 mnist 的 main.py 文件,完成后在 pytorch-env 环境中执行 `python main.py` 即可。

该命令将首先下载需要的数据,需要等待一会儿,然后就会开始训练神经网络了,如下图

f9336d4c2a08b4d6d7a9cf2294496dd1.png

b3d0bc02833ef349fef4d163474f63cb.png

195964b124dd56568fd0e0a7e1e74997.png

为了确定我确实用到了 GPU,在测试过程中,我们打开 GPU 的监视器查看 GPU 的使用率,如下

71b12fc091fe2ceece6be02aaeb8ac66.png

可以看到 python 的确使用了 883M GPU 的内存。

至此全部配置完成。

Everything seems to work.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值