ubuntu18.04中CUDA 10.0和pytorch1.3、tensorflow2.0的安装

最新推荐文章于 2024-08-03 11:32:27 发布

久许

最新推荐文章于 2024-08-03 11:32:27 发布

阅读量1.6k

点赞数 1

分类专栏： ubantu

本文链接：https://blog.csdn.net/jiuweideqixu/article/details/103943036

版权

ubantu 专栏收录该内容

21 篇文章 0 订阅

订阅专栏

①CUDA的安装和cuDNN的配置

貌似tensorflow2.0对CUDA的版本要求比较严格，目前好像cuda-10.0版本比较合适。前几天我试了cuda-10.1都不行，当然，这以后可能会改变。因为软件和它所依赖的软件都是在不断更新着的。
一、下载cuda-10.0的deb安装包并双击进行安装，然后如果有附加的补丁也一并安装

`sudo dpkg -i cuda-repo-ubuntu1804-10-0-local-10.0.130-410.48_1.0-1_amd64.deb`
`sudo apt-key add /var/cuda-repo-<version>/7fa2af80.pub`
`sudo apt-get update`
`sudo apt-get install cuda`

cuda会被默认安装在/usr/local目录下，安装之后会发现/usr/local目录下多了一个名为cuda的文件夹（后面cudnn的配置中相应的文件就拷贝到/usr/local/cuda目录中）。
安装完成之后，需要配置环境变量，配置环境变量的方法如下文步骤二。然后可以使用nvcc -V命令查看cuda的版本信息。
在这里插入图片描述

二、配置环境变量
vi ~/.bashrc
向ubuntu的家目录下的.bashrc文件中追加下面两行命令即可。

export PATH=/usr/local/cuda-10.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

三、cudnn的配置
在这里插入图片描述
1和2任意选一种即可(作用是相同的)。(3中会包含一些头文件(在开发编译深度学习程序时会用到))。当然，我们这里选择下载的是1 。

cudnn其实不用安装，它只是cuda使用的工具而已，有助于加快神经网络的处理速度和减少内存的占用。
cudnn-10.0-linux-x64-v7.6.5.32.tgz解压之后的根文件夹是cuda。所以把cudnn的cuda文件夹中的内容拷贝到cuda的安装目录：/usr/local/cuda的适当位置。

sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

②pytorch1.3.0的安装（对应cuda10.0版本）

.whl文件安装cuda10.0版本的pytorch1.3.0+torchvision0.4.1

在此找到对应的版本：https://download.pytorch.org/whl/cu100/torch_stable.html

$ wget https://download.pytorch.org/whl/cu100/torch-1.3.0%2Bcu100-cp36-cp36m-linux_x86_64.whl
$ wget https://download.pytorch.org/whl/cu100/torchvision-0.4.1%2Bcu100-cp36-cp36m-linux_x86_64.whl
$ pip3 install torch-1.3.0+cu100-cp36-cp36m-linux_x86_64.whl torchvision-0.4.1+cu100-cp36-cp36m-linux_x86_64.whl
>>>>>Processing ./torch-1.3.0+cu100-cp36-cp36m-linux_x86_64.whl
>>>>>Processing ./torchvision-0.4.1+cu100-cp36-cp36m-linux_x86_64.whl
>>>>>Collecting numpy (from torch==1.3.0+cu100)
>>>>>...................................................................
>>>>>Successfully installed numpy-1.17.3 pillow-6.2.1 six-1.12.0 torch-1.3.0+cu100 torchvision-0.4.1+cu100
$ python3
$ import torch
>>> print(torch.version.cuda)
10.0.130

③安装nvidia显卡驱动

参考https://blog.csdn.net/u014682691/article/details/80605201的方法二进行显卡驱动的安装。
如果想要让GPU发挥作用，那么需要安装显卡驱动。可知直接从http://www.nvidia.cn/page/home.html网站下载最新的驱动程序，然后进行安装（因为驱动具备向下兼容cuda的能力）。

④注意：cuda和显卡驱动的安装顺序

在本人的实践过程中，如果先安装驱动，后安装cuda，那么就会导致驱动和cuda之间无法进行通信的问题(因为cuda自身会默认驱动的版本，如果发现发现之前的驱动的版本不对会进行覆盖，这不是我们想要看到的)。后来改成了先安装cuda，后安装驱动，能够保证问题的解决。

参考https://blog.csdn.net/u014682691/article/details/80605201
的方法二，从官网选择下载最新的和自己的独立显卡类型相匹配的驱动程序。
在这里插入图片描述
并进行安装。
使用nvidia-smi进行查看

注意上图中显示的CUDA Version: 11.0，不要被这个误导，这个其实是一个指标，是该版本的驱动支持的CUDA的最大的版本号，如果我们实际使用的CUDA的版本低于11.0，那么本驱动也是支持的。

使用dkms status进行查看
在这里插入图片描述

PS: 如果我们先安装驱动，后安装cuda，那么再使用命令dkms status的时候，我们可能就看不到上图中的信息，因为在安装cuda之后，cuda会默认制定一个驱动的版本，而把我们之前安装的驱动的版本覆盖掉。所以建议安装的顺序是：先安装cuda，后安装显卡驱动。

//dkms add -m nvidia -v xxx.xx
//dkms remove -m nvidia -v xxx.xx --all

查看torch是否可以使用GPU：
在这里插入图片描述

⑤安装tensorflow2.0

pip install tensorflow-gpu==2.0.0-alpha0

在这里插入图片描述

久许

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录