ubuntu安装中文的命令行模式里中文会变成*
去软件和更新更换源为清华或者阿里的,设置更新尽量不更新
ssh服务端安装
sudo apt-get install openssh-server
lightdm安装
sudo apt-get install lightdm //若失败 命令后面加fix-missing再试试
然后接下来的页面将默认改为lightdm
然后sudo apt-get purge nvidia* //卸载预装的可能会造成错误驱动
sudo apt-get install gcc make//安装cuda需要用到gcc和make
官网下载cuda11.1和nvidia 470驱动 可以直接sudo apt-get install nvidia-driver-465
可以直接安装cuda(未成功),不安装nvdia驱动,因为里面包含nvidia驱动,也可以先安装470驱动来驱动cuda11.1(官方对应是455.32),cuda版本过高可能没有对应的pytorch版本...
驱动安装时要关掉图像界面 sudo service lightdm stop
还要禁用nouveau和secureboot(可选,secureboot有可能导致安装错误,有一定的风险) 禁用nouveau参考 1 禁用nouveau和secureboot参考2
然后用命令行界面进行安装 ,可以ssh,也可以切换到命令行模式,参考切换,亲测ctrl+alt+F3可以,ctrl+alt+F7可以切出去,切换后输入用户密码时 如果密码有数字,只能使用字母上面的数字输入,数字键盘无法识别,会导致login incorrect 我去。。。
若安装自己下载的驱动 :sudo sh 英伟达驱动名字(安装时library不用安装,dkms和community,x-config-unities安装选项安不安装都可以,dkms安装有时会报错,CC不匹配可以忽略,最好除了驱动其他的都不安装就能用,而且不容易产生问题)
若直接安装cuda(成功,还是先装个驱动吧,或者有问题就重新安装个驱动)CUDA Toolkit Archive | NVIDIA Developer
找到对应的版本按命令提示弄就行,直接装(deb(loacal那个)),没其他各种操作,也不需要提前装驱动
然后sudo sh cuda版本名字
安装cuda过程若已经安装驱动可以取消掉其中包含的nvidia驱动版本和samples 其他的默认就好了
还是不让安装就重启下再sudo service lightdm stop 就可以了
nvidia-smi 不成功或者驱动安装不成功可能设置bios 安全模式关闭就可以了
sudo sh cuda版本名字
安装cuda过程中取消掉其中包含的nvidia驱动版本和samples 其他的默认就好了
cuda环境变量设置:
sudo gedit ~/.bashrc
在末尾添加:
export CUDA_HOME=/usr/local/cuda-11.8
export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH
export PATH=/usr/local/cuda-11.8/bin:$PATH
刷新:
source ~/.bashrc
先reboot
再nvcc -V看是否安装成功 注意:必须先reboot 要不显示不成功
动态链接库设置:(跳过)
创建文件:
sudo gedit /etc/ld.so.conf.d/cuda.conf
写入:
/usr/local/cuda/lib64 #如果这里出错,那可以进入root权限再进行写入。 也有可能sudo无法写入 可以跳过至安装cudnn
使之生效:
sudo ldconfig -v
(cuda version检查:
nvcc -V
cuda version检查:(可省略)
1. cuda版本:
nvcc -V
2. Sample测试(进入Cuda的sample文件夹)
make (要几分钟的样子)#编译
进入Samples的 /1_Utilities/bandwidthTest目录,执行make命令,再运行./bandwidthTest程序,显示Result=Pass即为成功:
sudo ./deviceQuery #最后一行显示Result=Pass,就是安装成功了
运行bandwidthTest程序:
sudo ./bandwidthTest #最后一行显示Result=Pass,就是安装成功了)
报错:X service error问题
解决方法:
先到NVIDIA 官网上下载驱动文件(.run 格式)
1.按住CTRL+ALT+F1 进入命令行
2. sudo service lightdm stop 或者 sudo stop lightdm
3. sudo init 3 ###重点是这句话
4. 安装驱动程序: #: sudo ./NVIDIA-Linux-x86_64-177.67-pkg2.run //当前目录下执行NVIDIA驱动程序
5. 按照提示安装完成,简单方法重启就好了 sudo reboot
cudnn (直接从官网找对应版本就可以,linux(Tar)的就可以)(cuda1e变简单了,参考cuDNN 9.3.0 Downloads | NVIDIA Developer)
选择适合cuda11.1的cudnn版本 这里选的11.X 下下来时cudnn11.3
tar -zxvf cudnn-11.3...的名字.tar
tar -xf cudnn-(+name).tar.xz
cd {cudnn_dir}
sudo cp include/cudnn.h /usr/local/cuda/include/
sudo cp lib/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
检查 cudnn version
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2 //可能没有显示 不用管
安装anaconda,地址: Index of / (anaconda.com),找到对应版本链接复制下来wget就可以,其中有一个路径选项 安装到/home/用户名/anaconda3中
安装完再~/.bashrc 最后一行加入
PATH=~/anaconda3/bin:$PATH
然后source ~/.bashrc 然后reboot
添加清华镜像 复制下面到~/.condarc中
channels:
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/menpo/
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/pro
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
show_channel_urls: true
然后sudo apt-get update更新一下源
conda init 然后关闭终端 重新打开就是熟悉的(base)username:了
conda create -n envname (可以加上python=3.8来指定python版本,不加也行,安装pytorch的时候自动就安python了)
conda activate envname,先activate base
pip install torch==1.8.0+cu111 torchvision==0.9.0+cu111 torchaudio==0.8.0 -f https://download.pytorch.org/whl/torch_stable.html (这个目前不好用了)
conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pytorch-lts -c nvidia
pip install torch==1.10.0+cu111 torchvision==0.11.0+cu111 torchaudio==0.10.0 -f https://download.pytorch.org/whl/torch_stable.html
conda安装报错没权限就sudo chown -R zzq /home/zzq/anaconda3
pytorch1.8.0大小大概1.27G 太小了就是下错了 会运行不成功 要下对pytorch
ssh-keygen -t rsa -C "**@163.com"
记得cat id_rsa.pub >> authorized_keys,否则(可能github)和免密登录都不好用,copy的github代码链接不上git clone一下关上重新打开就好了 或者就在git clone的代码上改 先用下面的命令设置git,再测试连接性ssh -T git@github.com -p 22
下载vscode 安装python和 python extension扩展,ssh扩展,配置ssh的config,安装sudo apt-get install git
配置用户名邮箱
git config --global user.name "name"
git config --global user.email "**@163.com"