【深度学习环境配置】ubuntu 20.04+4060 Ti+CUDA 11.8+pytorch(装机、显卡驱动、CUDA、cudnn、pytorch)

【深度学习环境配置】ubuntu 20.04+4060 Ti+CUDA 11.8+pytorch(装机、显卡驱动、CUDA、cudnn、pytorch)

📆 安装时间 2023.11.08-2023.11.10

如何安装ubuntu20.04系统

Windows 和 Ubuntu 双系统的安装和卸载

B站教程

总体安装流程参考

【本文基本上跟这个详细教程一致,优先推荐看这个!】ubuntu20.04 下深度学习环境配置 史上最详细教程

【精品!】Ubuntu20.04下深度学习环境配置(持续维护)

一文掌握Ubuntu20.04深度学习环境搭建(显卡驱动、CUDA、CUDNN、NCCL、Pytorch、PaddlePaddle)

Ubuntu20.04配置深度学习环境

0. ubuntu 换源

20.04Ubuntu换源,有清华,中科大,阿里源
这个也是讲如何换源,跟第一个差不多,可以参考看看

pip换源与conda换源
pip临时和永久换源

主要结合这个的流程换源,精品文章

sudo cp /etc/apt/sources.list /etc/apt/sources.list.backup 
sudo gedit /etc/apt/sources.list

将原有的源都加#注释,在最后换成自己想要的源
换阿里源结果
在这里插入图片描述
更新

sudo apt-get update
sudo apt-get upgrade

在这里插入图片描述


阿里云

deb http://mirrors.aliyun.com/ubuntu/ focal main restricted
deb http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted
deb http://mirrors.aliyun.com/ubuntu/ focal universe
deb http://mirrors.aliyun.com/ubuntu/ focal-updates universe
deb http://mirrors.aliyun.com/ubuntu/ focal multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-updates multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-security main restricted
deb http://mirrors.aliyun.com/ubuntu/ focal-security universe
deb http://mirrors.aliyun.com/ubuntu/ focal-security multiverse

1. 禁用nouveau

如何禁用nouveau,就按照这个精品文章来

// 修改属性
sudo chmod 666 /etc/modprobe.d/blacklist.conf  
//用gedit打开
sudo gedit /etc/modprobe.d/blacklist.conf
// 在最后一行加入以下几句,保存退出
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist rivatv
blacklist nvidiafb
// 对刚才修改的文件进行更新
sudo update-initramfs -u

记得重启计算机,打开终端检查nouveau是否被禁用

若执行完该句,没有任何输出,则nouveau被成功禁用

lsmod | grep nouveau 

2. 安装gcc

如何安装gcc,也按照这个精品文章来

安装gcc,不要怀疑,就是build-essential,我也不知道为啥

sudo apt-get  install  build-essential

检查gcc是否安装成功

gcc --version

在这里插入图片描述

2.5 安装python

是按照这个博客的流程安装python的,感觉也不用安装

sudo update-alternatives --install /usr/bin/python python /usr/bin/python3 150

在这里插入图片描述

3. 🌟🌟🌟安装显卡驱动 (此步很重要)

如何在没有安装显卡驱动,不能用nvidia-smi情况下,查看显卡型号


参考这个博客的方法安装显卡驱动,只安驱动,不安cuda toolkit
⭐️ 这个安装方式不会黑屏

注:如果哪天因为安装驱动黑屏了,看这个!有效!

软件和更新中安装,图标长下面这样
软件和更新

要注意cuda版本对显卡驱动有要求, 官网要求
显卡、显卡驱动版本、cuda版本和Pytorch相互之间的依赖关系
在这里插入图片描述按照下图的选择安装,点击应用更改开始安装,这里安装525版本的显卡驱动,

在这里插入图片描述然后启动终端,分别进行命令sudo apt updatesudo apt upgrade(两个命令顺序不可乱)手动对刚刚的更改进行更新(有点慢,耐心等待)。之后重启!重启!重启!!

第四步,使用命令nvidia-smi查看驱动是否成功
检查显卡驱动是否正常

nvidia-smi

在这里插入图片描述
关于nvidia-smi 显示的cuda版本的说明
按照上述博客,上图的CUDA Version:12.0指的是最高支持cuda12.0的版本,并不是已经安装了cuda12.0的版本,可以安装cuda11.8版本

4. 安装cuda

这个也挺好的,可以看一下整个安装流程,有验证,Ububtu20.04 CUDA安装与环境配置、CUDNN安装


如何卸载cuda和显卡驱动
如果需要卸载已经安装的CUDA和nvidia驱动,输入下面两条命令

#To remove CUDA Toolkit:
sudo apt-get --purge remove "*cuda*" "*cublas*" "*cufft*" "*cufile*" "*curand*" \
 "*cusolver*" "*cusparse*" "*gds-tools*" "*npp*" "*nvjpeg*" "nsight*" "*nvvm*"

#To remove NVIDIA Drivers:
sudo apt-get --purge remove "*nvidia*" "libxnvctrl*"

#To clean up the uninstall:
sudo apt-get autoremove

别忘了再执行下面的命令

sudo rm -rf /usr/local/cuda-xx.x

为什么加入这句,看这个博客
最后边加了一句sudo rm -rf /usr/local/cuda-xx.x,这是因为一般情况下cuda都配置了cudnn,在运行卸载程序时只会卸载cuda而不会一并删除cudnn的文件。因为cudnn文件还在的缘故,自己的cuda-xx.x文件夹仍然在,需要手动删除。
所以如果自己要卸载的cuda没有配置cudnn,那么cuda-xx.x文件夹在卸载完成后会被自动删除,也就没必要再运行最后一句了

本次安装11.8,为了稳定
非常重要,如何正确安装CUDA,一定要严格按照这个博客步骤!!

这个博客安装cuda步骤也是一样,可以结合着看

按照上述第1个博客的步骤,要选择下图中的配置进行安装,特别注意Install Type
❌ 如果选择deb(local),则会自动安装所下载cuda的显卡驱动,导致以安装的显卡驱动和自动下载的显卡驱动冲突,导致以后安装pytorch识别不了cuda,以及各种问题
✔️ 选择 runfile(local),可以手动选择是否安装显卡驱动,解决问题
在这里插入图片描述安装命令行

wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run

sudo sh cuda_11.8.0_520.61.05_linux.run

安装时,仍会提示目标CUDA toolkit对应版本的显卡驱动未被发现,推荐我们安装其版本的显卡驱动,这时我们键入continue,再键入accept同意用户协议,然后将光标移动到driver处,键入回车,以取消对驱动的安装:其他的保持不动,选择“Install”,稍等几分钟就装好了
在这里插入图片描述
在这里插入图片描述
出现下面界面,则安装成功
在这里插入图片描述
添加环境变量
此步参考这个博客

echo 'export PATH=/usr/local/cuda-11.8/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

检查cuda版本

nvcc -V

在这里插入图片描述
再次检查显卡驱动是否正常

nvidia-smi

在这里插入图片描述

----------不要看下面的-----------

暂时安装12.1 版本的CUDA,想装11.7或11.8都不行,放弃
为什么是12.1,发现pytorch官网有12.1安装pytorch的命令行
12.1官网
在这里插入图片描述

按照下面给的命令行一行一行安装

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin

sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600

wget https://developer.download.nvidia.com/compute/cuda/12.1.0/local_installers/cuda-repo-ubuntu2004-12-1-local_12.1.0-530.30.02-1_amd64.deb

sudo dpkg -i cuda-repo-ubuntu2004-12-1-local_12.1.0-530.30.02-1_amd64.deb

sudo cp /var/cuda-repo-ubuntu2004-12-1-local/cuda-*-keyring.gpg /usr/share/keyrings/

sudo apt-get update

sudo apt-get -y install cuda

添加环境变量

echo 'export PATH=/usr/local/cuda-12.1/bin:$PATH' >> ~/.bashrc

echo 'export LD_LIBRARY_PATH=/usr/local/cuda-12.1/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc

source ~/.bashrc

----------不要看上面的-----------

5. 安装miniconda

安装miniconda3教程

安装路径 /home/miniconda3
最后一步环境变量配置改为下面:

echo 'export PATH="/home/miniconda3/bin:$PATH"'>> ~/.bashrc
source ~/.bashrc

在这里插入图片描述
conda如何创建和删除环境
创建环境

conda create -n pytorch_gpu python=3.8

删除环境

conda remove -n pytorch_gpu --all 
# 必须要加all

进入环境
(1)先进入base环境

# 进入base环境
source activate
# 退出环境
source deactivate

(2)进入自己的环境

conda activate pytorch_gpu

(2.5)上面进入base环境,再进入自己的环境可以合并成一个命令

source activate pytorch_gpu

6. 安装cudnn

首先进入自己的环境中
然后进入官网,下载对应的版本

cudnn官网下载地址

暂时选择11.x 中 第2个下载选择,Linux_x86_64(Tar)
在这里插入图片描述注意下载完后将文件复制到电脑的home文件夹下
在这里插入图片描述

如何解压各种形式的文件
解压

tar -xf cudnn-linux-x86_64-8.9.6.50_cuda11-archive.tar.xz

进入文件夹

cd cudnn-linux-x86_64-8.9.6.50_cuda11-archive/

执行下面两个命令,复制文件

sudo cp -d -r ./lib/* /usr/local/cuda-11.8/lib64/
sudo cp -r ./include/* /usr/local/cuda-11.8/include/

赋予权限

sudo chmod a+r /usr/local/cuda-11.8/include/cudnn.h /usr/local/cuda-11.8/lib64/libcudnn*

查看信息

cat /usr/local/cuda-11.8/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

在这里插入图片描述

好像成功
从这开始先去安装pytorch

7. 安装pytorch

就按照官网的给的命令安装就行,不用conda,conda慢,用pip3,快
pytorch官网
命令,本机cuda11.8对应的pytorch

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

在这里插入图片描述
验证pytorch是否安装成功

python
import torch
from torch.backends import  cudnn
print(cudnn.is_available())
print(torch.backends.cudnn.version())
torch.cuda.is_available()
# True,则gpu版本的pytorch安装成功
torch.zeros(1).cuda()

结果,成功了
在这里插入图片描述

在这里插入图片描述


关于conda、pip换源安装pytorch,可以参考下面的博客,以防万一
ubuntu20.04 更换conda,pip源并下载pytorch


-----------------不用看下面的离线安装------------
如果哪天需要离线安装,可以参考下面的博客
ubuntu安装pytorch的CPU版本GPU版本,分conda安装和pip安装,以及whl离线安装pytorch

pytorch离线下载列表
torchvision离线下载列表
选择紫色的cu121
在这里插入图片描述


8. 所有都安装成功,验证cuda,pytorch,cudnn

python
import torch
from torch.backends import  cudnn
print(cudnn.is_available())
print(torch.backends.cudnn.version())
torch.cuda.is_available()
# True,则gpu版本的pytorch安装成功
torch.zeros(1).cuda()

在这里插入图片描述

9. 安装编辑器,如pycharm

安装pycharm

10. 其他参考博客

安装搜狗输入法和截图程序

这个也挺好的,Ububtu20.04 CUDA安装与环境配置、CUDNN安装

【看看怎么卸载】 ubuntu20.04 显卡驱动,CUDA 安装和卸载,cudnn安装

pip换源与conda换源

pip临时和永久换源


pip3 install scikit-learn -i https://pypi.tuna.tsinghua.edu.cn/simple

不要加 --user 否则会安装到全局
安装cv2

pip3 install opencv-python -i https://pypi.tuna.tsinghua.edu.cn/simple
  • 10
    点赞
  • 67
    收藏
    觉得还不错? 一键收藏
  • 7
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值