ubuntu18.04中CUDA 10.0和pytorch1.3、tensorflow2.0的安装

①CUDA的安装和cuDNN的配置

貌似tensorflow2.0对CUDA的版本要求比较严格,目前好像cuda-10.0版本比较合适。前几天我试了cuda-10.1都不行,当然,这以后可能会改变。因为软件和它所依赖的软件都是在不断更新着的。
一、下载cuda-10.0的deb安装包并双击进行安装,然后如果有附加的补丁也一并安装

`sudo dpkg -i cuda-repo-ubuntu1804-10-0-local-10.0.130-410.48_1.0-1_amd64.deb`
`sudo apt-key add /var/cuda-repo-<version>/7fa2af80.pub`
`sudo apt-get update`
`sudo apt-get install cuda`

cuda会被默认安装在/usr/local目录下,安装之后会发现/usr/local目录下多了一个名为cuda的文件夹(后面cudnn的配置中相应的文件就拷贝到/usr/local/cuda目录中)。
安装完成之后,需要配置环境变量,配置环境变量的方法如下文步骤二。然后可以使用nvcc -V命令查看cuda的版本信息。
在这里插入图片描述

二、配置环境变量
vi ~/.bashrc
向ubuntu的家目录下的.bashrc文件中追加下面两行命令即可。

export PATH=/usr/local/cuda-10.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

三、cudnn的配置
在这里插入图片描述
1和2任意选一种即可(作用是相同的)。(3中会包含一些头文件(在开发编译深度学习程序时会用到))。当然,我们这里选择下载的是1 。

cudnn其实不用安装,它只是cuda使用的工具而已,有助于加快神经网络的处理速度和减少内存的占用。
cudnn-10.0-linux-x64-v7.6.5.32.tgz解压之后的根文件夹是cuda。所以把cudnn的cuda文件夹中的内容拷贝到cuda的安装目录:/usr/local/cuda的适当位置。

sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

②pytorch1.3.0的安装(对应cuda10.0版本)

.whl文件安装cuda10.0版本的pytorch1.3.0+torchvision0.4.1

在此找到对应的版本:https://download.pytorch.org/whl/cu100/torch_stable.html

$ wget https://download.pytorch.org/whl/cu100/torch-1.3.0%2Bcu100-cp36-cp36m-linux_x86_64.whl
$ wget https://download.pytorch.org/whl/cu100/torchvision-0.4.1%2Bcu100-cp36-cp36m-linux_x86_64.whl
$ pip3 install torch-1.3.0+cu100-cp36-cp36m-linux_x86_64.whl torchvision-0.4.1+cu100-cp36-cp36m-linux_x86_64.whl
>>>>>Processing ./torch-1.3.0+cu100-cp36-cp36m-linux_x86_64.whl
>>>>>Processing ./torchvision-0.4.1+cu100-cp36-cp36m-linux_x86_64.whl
>>>>>Collecting numpy (from torch==1.3.0+cu100)
>>>>>...................................................................
>>>>>Successfully installed numpy-1.17.3 pillow-6.2.1 six-1.12.0 torch-1.3.0+cu100 torchvision-0.4.1+cu100
$ python3
$ import torch
>>> print(torch.version.cuda)
10.0.130

③安装nvidia显卡驱动

参考https://blog.csdn.net/u014682691/article/details/80605201的方法二进行显卡驱动的安装。
如果想要让GPU发挥作用,那么需要安装显卡驱动。可知直接从http://www.nvidia.cn/page/home.html网站下载最新的驱动程序,然后进行安装(因为驱动具备向下兼容cuda的能力)。

④注意:cuda和显卡驱动的安装顺序

在本人的实践过程中,如果先安装驱动,后安装cuda,那么就会导致驱动和cuda之间无法进行通信的问题(因为cuda自身会默认驱动的版本,如果发现发现之前的驱动的版本不对会进行覆盖,这不是我们想要看到的)。后来改成了先安装cuda,后安装驱动,能够保证问题的解决。

参考https://blog.csdn.net/u014682691/article/details/80605201
的方法二,从官网选择下载最新的和自己的独立显卡类型相匹配的驱动程序。
在这里插入图片描述
并进行安装。
使用nvidia-smi进行查看
在这里插入图片描述
注意上图中显示的CUDA Version: 11.0,不要被这个误导,这个其实是一个指标,是该版本的驱动支持的CUDA的最大的版本号,如果我们实际使用的CUDA的版本低于11.0,那么本驱动也是支持的。

使用dkms status进行查看
在这里插入图片描述

PS: 如果我们先安装驱动,后安装cuda,那么再使用命令dkms status的时候,我们可能就看不到上图中的信息,因为在安装cuda之后,cuda会默认制定一个驱动的版本,而把我们之前安装的驱动的版本覆盖掉。所以建议安装的顺序是:先安装cuda,后安装显卡驱动。

//dkms add -m nvidia -v xxx.xx
//dkms remove -m nvidia -v xxx.xx --all

查看torch是否可以使用GPU:
在这里插入图片描述

⑤安装tensorflow2.0

pip install tensorflow-gpu==2.0.0-alpha0

在这里插入图片描述
在这里插入图片描述

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值