一、安装驱动
1、检查硬件支持的驱动列表:
# 桌面版本
sudo ubuntu-drivers list
# 服务器版本
sudo ubuntu-drivers list --gpgpu
可以看到这样的驱动名称列表:
nvidia-driver-470
nvidia-driver-470-server
nvidia-driver-535
nvidia-driver-535-open
nvidia-driver-535-server
nvidia-driver-535-server-open
nvidia-driver-550
nvidia-driver-550-open
nvidia-driver-550-server
nvidia-driver-550-server-open
2、安装驱动
自动安装推荐的驱动:
sudo ubuntu-drivers install
或者选择一个驱动版本安装,例如 nvidia-driver-535-server
,截取后缀 535-server
:
sudo ubuntu-drivers install --gpgpu nvidia:535-server
重启服务器,就可以使用 nvidia-smi
命令查看信息了。
二、安装 conda
可以选择安装 Anaconda 或 Miniconda,安装方式比较相似,我这里安装的是 Anaconda。
首先在官网下载合适版本的 Anaconda-xxx.sh
并给它可执行权限:
chmod +x Anaconda3-2024.02-1-Linux-x86_64.sh
应该把它安装到什么位置呢?参考 How and where to install conda to be accessible to all users,为了方便这台服务器的所有用户都可以使用到这个conda,可以把它安装到 /opt
下面。
./Anaconda3-2024.02-1-Linux-x86_64.sh -b -p /opt/anaconda3
如果安装完成后无法直接使用 conda
命令,可以进入安装目录手动初始化:
cd /opt/anaconda3/bin
./conda init
这样就可以使用 conda 命令了,在重新打开 shell 时会自动激活 (base)
,也可以手动设置关闭或开启:
设置是否需要每次进入shell时自动激活 (base)
环境(默认为 true
):
conda config --set auto_activate_base false
conda config --set auto_activate_base true
接下来,可以创建一个自定义名称的 conda env,同时可以指定希望使用的 Python 版本:
conda create -n your_env_name python=3.9
conda activate your_env_name
设置 pip 源:
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple