吐血整理 亲测有用 3080ti cuda pytorch深度学习环境安装

ubuntu安装中文的命令行模式里中文会变成*

去软件和更新更换源为清华或者阿里的,设置更新尽量不更新

ssh服务端安装

sudo apt-get install openssh-server 

lightdm安装

sudo apt-get install lightdm  //若失败  命令后面加fix-missing再试试

然后接下来的页面将默认改为lightdm

然后sudo apt-get purge nvidia* //卸载预装的可能会造成错误驱动

sudo apt-get install gcc make//安装cuda需要用到gcc和make

官网下载cuda11.1和nvidia 470驱动  可以直接sudo apt-get install nvidia-driver-465

可以直接安装cuda(未成功),不安装nvdia驱动,因为里面包含nvidia驱动,也可以先安装470驱动来驱动cuda11.1(官方对应是455.32),cuda版本过高可能没有对应的pytorch版本...

驱动安装时要关掉图像界面 sudo service lightdm stop 

还要禁用nouveau和secureboot(可选,secureboot有可能导致安装错误,有一定的风险) 禁用nouveau参考 1 禁用nouveau和secureboot参考2
然后用命令行界面进行安装 ,可以ssh,也可以切换到命令行模式,参考切换,亲测ctrl+alt+F3可以,ctrl+alt+F7可以切出去,切换后输入用户密码时 如果密码有数字,只能使用字母上面的数字输入,数字键盘无法识别,会导致login  incorrect 我去。。。

若安装自己下载的驱动 :sudo sh 英伟达驱动名字(安装时library不用安装,dkms和community,x-config-unities安装选项安不安装都可以,dkms安装有时会报错,CC不匹配可以忽略,最好除了驱动其他的都不安装就能用,而且不容易产生问题)

若直接安装cuda(成功,还是先装个驱动吧,或者有问题就重新安装个驱动)CUDA Toolkit Archive | NVIDIA Developer

找到对应的版本按命令提示弄就行,直接装(deb(loacal那个)),没其他各种操作,也不需要提前装驱动

然后sudo sh cuda版本名字
安装cuda过程若已经安装驱动可以取消掉其中包含的nvidia驱动版本和samples 其他的默认就好了

还是不让安装就重启下再sudo service lightdm stop 就可以了
nvidia-smi 不成功或者驱动安装不成功可能设置bios 安全模式关闭就可以了


sudo sh cuda版本名字
安装cuda过程中取消掉其中包含的nvidia驱动版本和samples 其他的默认就好了

cuda环境变量设置:
    
sudo gedit ~/.bashrc
在末尾添加:
export CUDA_HOME=/usr/local/cuda-11.8
export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH
export PATH=/usr/local/cuda-11.8/bin:$PATH
刷新:
source ~/.bashrc
先reboot
再nvcc -V看是否安装成功  注意:必须先reboot  要不显示不成功

动态链接库设置:(跳过)
创建文件:
sudo gedit /etc/ld.so.conf.d/cuda.conf
写入:
/usr/local/cuda/lib64   #如果这里出错,那可以进入root权限再进行写入。  也有可能sudo无法写入  可以跳过至安装cudnn
    
使之生效:
sudo ldconfig -v

(cuda version检查:
nvcc -V

cuda version检查:(可省略)
    1. cuda版本:
        nvcc -V
    2. Sample测试(进入Cuda的sample文件夹)
        make (要几分钟的样子)#编译
        进入Samples的 /1_Utilities/bandwidthTest目录,执行make命令,再运行./bandwidthTest程序,显示Result=Pass即为成功:
            sudo ./deviceQuery #最后一行显示Result=Pass,就是安装成功了
        运行bandwidthTest程序:
            sudo ./bandwidthTest #最后一行显示Result=Pass,就是安装成功了) 

报错:X service error问题

解决方法:

先到NVIDIA 官网上下载驱动文件(.run 格式)
1.按住CTRL+ALT+F1 进入命令行

2.    sudo service lightdm stop    或者   sudo stop lightdm

3.    sudo init 3 ###重点是这句话

4.  安装驱动程序:     #:  sudo    ./NVIDIA-Linux-x86_64-177.67-pkg2.run      //当前目录下执行NVIDIA驱动程序

5.   按照提示安装完成,简单方法重启就好了     sudo  reboot


cudnn (直接从官网找对应版本就可以,linux(Tar)的就可以)(cuda1e变简单了,参考cuDNN 9.3.0 Downloads | NVIDIA Developer
选择适合cuda11.1的cudnn版本 这里选的11.X 下下来时cudnn11.3

tar -zxvf cudnn-11.3...的名字.tar 

tar -xf cudnn-(+name).tar.xz

cd {cudnn_dir}
sudo cp include/cudnn.h /usr/local/cuda/include/

sudo cp lib/libcudnn* /usr/local/cuda/lib64/

sudo chmod a+r /usr/local/cuda/include/cudnn.h

sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

检查 cudnn version

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2    //可能没有显示 不用管

安装anaconda,地址: Index of / (anaconda.com),找到对应版本链接复制下来wget就可以,其中有一个路径选项 安装到/home/用户名/anaconda3中

安装完再~/.bashrc 最后一行加入

PATH=~/anaconda3/bin:$PATH

然后source ~/.bashrc 然后reboot

添加清华镜像 复制下面到~/.condarc中

channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/menpo/
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/pro
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
show_channel_urls: true

然后sudo apt-get update更新一下源

conda init 然后关闭终端 重新打开就是熟悉的(base)username:了

conda create -n  envname (可以加上python=3.8来指定python版本,不加也行,安装pytorch的时候自动就安python了)

conda activate envname,先activate base

pip install torch==1.8.0+cu111 torchvision==0.9.0+cu111 torchaudio==0.8.0 -f https://download.pytorch.org/whl/torch_stable.html (这个目前不好用了)

conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pytorch-lts -c nvidia
pip install torch==1.10.0+cu111 torchvision==0.11.0+cu111 torchaudio==0.10.0 -f https://download.pytorch.org/whl/torch_stable.html

conda安装报错没权限就sudo chown -R zzq /home/zzq/anaconda3


pytorch1.8.0大小大概1.27G  太小了就是下错了  会运行不成功 要下对pytorch

ssh-keygen -t rsa -C "**@163.com"

记得cat id_rsa.pub >> authorized_keys,否则(可能github)和免密登录都不好用,copy的github代码链接不上git clone一下关上重新打开就好了 或者就在git clone的代码上改 先用下面的命令设置git,再测试连接性ssh -T git@github.com -p 22

下载vscode 安装python和 python extension扩展,ssh扩展,配置ssh的config,安装sudo apt-get install git

 配置用户名邮箱

git config --global user.name "name"

git config --global user.email "**@163.com"

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值