查看自己系统是不是ubuntu:
安装Nvidia驱动前需要禁用Nouveau驱动,用命令ubuntu-drivers devices 查看显卡,用命令sudo ubuntu-drivers autoinstall 自动安装已推荐的驱动。
如果遇到ubuntu系统内部错误,执行sudo apt-get purge 清除升级的软件包和依赖文件即可。
网卡配置和重启
ubuntu 重启命令,ubuntu 重启网卡方法-CSDN博客
查看网卡信息: ifconfig
方法①: 用ubuntu的系统——>系统管理——>网络的网络设置
方法②:ubuntu网卡配置文件/etc/network/interfaces 编辑网卡配置 sudo vim /etc/network/interfaces,修改后输入":wq" 保存关闭。
关闭网卡 ifdown eth0
开启网卡 ifup eth0
重启网卡,优点是可以指定网卡,不影响其他网络接口
安装Anaconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=M&O=D中选择合适的文件,我选的是Anaconda3_2024.02.1-Linux-x86_64.sh, 下载完成后,在程序下载所在的文件夹下,打开终端,输入sh. + 文件名称,回车,安装即可。
conda create -n ydm python=3.10
禁用Nouveau:
安装Nvidia网卡直接 ubuntu-drivers devices
按照推荐的驱动安装即可。
sudo vim /etc/modprobe.d/blacklist.conf
按i,进入插入模式,在文本后添加:blacklist nouveau
options nouveau modeset=0
Esc退出插入模式,:wq保存退出。
sudo update-initramfs -u
sudo reboot.
重启后,lsmod | grep nouveau, 无输出,即禁用成功。完成以上步骤后,您应该可以安装NVIDIA的官方驱动程序了。具体参考 凌逆战CSDN:
安装CUDA 12.1
,不要超过nvidia-smi中的CUDA 版本。
由于 Pytorch 和 TensorFlow 对于 CUDA 都有特定的版本需求,所以在安装 CUDA 之前,我们首先需要查询,我们想要安装的 pytorch 版本对应的 CUDA 版本。
pytorch 的配套环境要求见:https://pytorch.org/
在 https://developer.nvidia.com/cuda-toolkit-archive 中选择你要安装的CUDA版本
最后使用命令 source ~/.bashrc 使它生效。可以使用命令 nvcc -V 查看安装的版本信息。
使用指定GPU
做好GPU的分配,比如我们有四张显卡,只想使用第1个和第4个GPU,有以下两种方法:
1、在终端设定:
CUDA_VISIBLE_DEVICES=0,3 python my_script.py
2、在代码中设定
import os
os.environ['CUDA_VISIBLE_DEVICES'] = '0,3'