Ubuntu18 安装nvidia驱动进行深度学习训练

2 篇文章 0 订阅
1 篇文章 0 订阅

安装nvidia驱动

由于本人的显卡是MX系列显卡,从官网上下载驱动会造成Ubuntu18的循环登录,因此需要ppa 源安装驱动。首先需要禁用nouveau驱动,使用vim工具打开blacklist.conf 文件。

sudo vim /etc/modprobe.d/blacklist.conf

这里使用键盘i键,在文件末尾插入如下命令

blacklist nouveau
options nouveau modeset=0

按Esc 退出插入模式,再输入:wq 保存文件后退出。
vim工具可采用如下命令安装:

sudo apt install vim

之后添加ppa源

sudo add-apt-repository ppa:graphics-drivers/ppa  
sudo apt-get update

然后使用

ubuntu-drivers devices

查看推荐版本的驱动,这里要安装推荐版本的驱动,否则也有可能因为驱动与硬件设备不兼容造成循环登录
在这里插入图片描述之后使用

sudo apt-get install nvidia-driver-470

安装驱动。
这里安装驱动后不会立即生效,需要重启Ubuntu系统,之后输入nvidia-smi,如果可以看到如下页面,则说明驱动安装成功。(这里cuda version 显示的只是系统最高可以支持的版本,不是当前系统的cuda版本,系统安装的cuda版本可以比这个版本要低)
在这里插入图片描述

驱动不兼容而造成系统循环登录的解决方案

参考https://blog.csdn.net/sheqianweilong/article/details/106220751, 卸载之前安装过的驱动,恢复原驱动。

安装cuda

从cuda官网上https://developer.nvidia.cn/cuda-toolkit-archive下载对应的cuda安装包,这里我下载的是cuda 10.1
在这里插入图片描述
点击cuda链接之后,选择对应的版本,然后将命令行

wget https://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.243_418.87.00_linux.run

粘贴到Ubuntu终端上即可完成cuda的下载。
之后,输入

sudo sh cuda_10.1.243_418.87.00_linux.run

完成cuda的安装。
之后使用命令行,配置cuda的环境变量

echo 'export PATH=/usr/local/cuda-10.1/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

在这里插入图片描述最后,使用

nvcc -V

cat /usr/local/cuda/version.txt

查看cuda版本,若出现如下页面,则安装成功。
在这里插入图片描述
如果找不到上述命令,可使用

sudo apt-get install nvidia-cuda-toolkit

安装nvidia-cuda-tookit之后,再使用nvcc -V查看

安装cudnn

从cudnn官网https://developer.nvidia.cn/rdp/cudnn-archive下载cudnn的linux安装包 。这里下载cuDNN Library for linux, 之后选择cuDNN Library for Linux。如果之前没有账号,可能需要花费较长时间注册nvidia账号,可以从https://download.csdn.net/download/lhe159324/67504649下载cuDNN压缩包
在这里插入图片描述在终端使用

tar -xzvf cudnn-10.1-linux-x64-v7.6.1.34.tgz

解压cudnn压缩包,将cudnn中的相应文件,移动到cuda文件夹中的对应位置。

sudo cp cuda/include/cudnn.h /usr/local/cuda-10.1/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.1/lib64
sudo chmod a+r /usr/local/cuda-10.1/include/cudnn.h /usr/local/cuda-10.1/lib64/libcudnn*

之后使用

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

查看cudnn版本,若出现如下页面,则安装成功。
在这里插入图片描述

下载anacoda3

从清华镜像https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/中下载anancoda3,这里下载Anacoda3 .5.1 。
在这里插入图片描述 使用以下命令安装

bash Anaconda3-5.1.0-Linux-x86_64.sh  

最后配置清华镜像源

conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/menpo/
conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/
conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge 
conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
conda config --set show_channel_urls yes

这里由于使用https协议,conda 会出现网络无法访问的问题,因此使用http协议。

找不到conda命令的解决方法

使用vim 工具打开/.bashrc文件,

sudo vim ~/.bashrc

在文件末尾添加

export PATH="~/anaconda3/bin:$PATH"

之后按:wq 保存退出。
在这里插入图片描述
之后输入

 source ~/.bashrc

使其立即生效。

搭建pytorch 虚拟环境

创建虚拟环境.(这里要安装python 3.6.2及以上,使用python3.6.0 及以下会出现找不到pytorch模块问题)

conda  create -n pytorch-test python==3.6.2

激活虚拟环境

source activate pytorch-test

安装pytorch

conda install pytorch==1.2.0 torchvision==0.4.0 cudatoolkit=10.0  

检测gpu是否可用

python # 进入python环境
>>> import torch
>>> torch.cuda.is_available()#  检查GPU是否可用
True

其他常用工具的安装

采用pip方法安装第三方库

 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple 包名称

git安装

sudo apt-get install git
  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
要在Ubuntu 20.04上进行深度学习,您可以按照以下步骤进行操作: 1. 首先,您需要安装NVIDIA显卡驱动程序。您可以从NVIDIA官方网站下载并安装适用于您的显卡的驱动程序。请确保选择与您的显卡型号和操作系统版本相匹配的驱动程序。 2. 接下来,您需要安装CUDA Toolkit。CUDA是NVIDIA的并行计算平台,它可以加速深度学习任务。您可以从NVIDIA开发者网站下载适用于Ubuntu 20.04的CUDA Toolkit,并按照安装说明进行安装。 3. 安装cuDNN库。cuDNN是一个针对深度学习任务进行优化的GPU加速库。您可以从NVIDIA开发者网站下载适用于您的CUDA版本的cuDNN,并按照安装说明进行安装。 4. 安装深度学习框架。在Ubuntu 20.04上,您可以选择安装常见的深度学习框架,如TensorFlow、PyTorch或Keras。您可以使用pip或conda命令来安装这些框架,具体取决于您的偏好和环境设置。 5. 准备数据集和模型。在进行深度学习之前,您需要准备相应的数据集和模型。您可以从公开的数据集资源中下载数据集,并选择适合您任务的预训练模型。 6. 编写和运行代码。根据您的需求,编写相应的深度学习代码。您可以使用Python及相应的深度学习库来实现您的模型和算法。运行代码时,请确保您的环境已正确配置,并使用GPU进行加速。 总结:要在Ubuntu 20.04上进行深度学习,您需要安装NVIDIA显卡驱动程序、CUDA Toolkit和cuDNN库,并安装适合您的深度学习框架。然后,准备数据集和模型,并编写和运行您的代码。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值