一、更换NVIDIA驱动
1. 查看显卡驱动
在终端输入,本人的显卡是GTX 1080 ti
lspci | grep -i nvidia
2.下载驱动
在英伟达官网下载对应的驱动(https://www.nvidia.cn/Download/index.aspx?lang=cn),本人下载的是NVIDIA-Linux-x86_64-465.19.run
3. 卸载原有驱动(没有可以跳过这步)
sudo apt-get purge nvidia*
4. 禁用nouveau
(1) 修改配置文件blacklist.conf的文件属性
sudo chmod 666 /etc/modprobe.d/blacklist.conf
(2) 用gedit打开
sudo gedit /etc/modprobe.d/blacklist.conf
(3) 在尾部增加以下语句,并保存退出
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist rivatv
blacklist nvidiafb
(4) 更新文件并重启(一定要重启)
sudo update-initramfs -u
sudo reboot //重启
(5) 检查nouveau是否已禁用
lsmod | grep nouveau
若没有信息提示,则禁用成功
5. 安装驱动
Ctrl+Alt+F1快捷键进入字符界面,会有登录,输入用户名和密码(注意:密码不要使用小键盘输入,否则会登录失败)
(如果想退出字符界面,Ctrl+Alt+F7退出字符界面)
(1) 关掉图形界面
sudo service lightdm stop
想要打开图形界面
sudo service lightdm start
(2) 给.run文件赋予执行权限
sudo chmod a+x NVIDIA-Linux-x86_64-465.19.run //后面的.run文件需要根据自己下载的版本更改
(3) 进行安装
sudo ./NVIDIA-Linux-x86_64-465.19.run -no-x-check -no-nouveau -no-opengl-files
-no-x-check 安装驱动时关闭X服务,
-no-nouveau 安装驱动时禁用nouveau
-no-opengl-files 只安装驱动,不安装opengl文件
(4) 中间可能遇见的选项
问题1:The distribution-provided pre-install script failed! Are you sure you want to continue?
Continue installation Abort installation (选择Coninue)
问题2:Would you like to register the kernel module sources with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later.
Yes No (选 No)
问题3:Install NVIDIA’s 32-bit compatibility libraries?
Yes No (选 No)
问题4: Installation of the kernel module for the NVIDIA Accelerated Graphics Driver for Linux-x86_64 (version470.94) is now complete.
OK
问题5: Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up.
Yes No (选 Yes)
(5) 挂载Nvidia驱动
modprobe nvidia
(6) 打开图形界面和退出字符界面
sudo service lightdm start
Ctrl+Alt+F7退出字符界面
(7) 检查驱动是否安装成功
nvidia-smi
二、安装cuda
1.删除历史版本
以cuda8.0版本为例(由于本人之前并未安装过,所以删除是从网上借鉴的步骤)
sudo /usr/local/cuda-8.0/bin/uninstall_cuda_8.0.pl
卸载之后,会发现 /usr/local/cuda-8.0目录下任然有文件存在,这是cudnn文件,所以还需要将cuda-8.0文件删除干净
sudo rm -rf /usr/local/cuda-8.0
#或者
sudo apt autoremove cuda
sudo apt --purge remove "*cublas*" "cuda*"
2.下载cuda
本人选择11.3.0版本,也可以自行选择,官网地址 https://developer.nvidia.com/cuda-toolkit-archive
3.执行安装指令
wget https://developer.download.nvidia.com/compute/cuda/11.3.0/local_installers/cuda_11.3.0_465.19.01_linux.run
sudo sh cuda_11.3.0_465.19.01_linux.run
中间遇见选项
问题1:Do you accept the previously read EULA? (输入accpet)
问题2:“Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81? (一定要输入no,否则将覆盖之前安装的驱动)
其余问题:都输入yes
查看是否安装成功
nvcc -V
三、安装cudnn
1.下载cudnn
cudnn版本要与cuda对应,官网地址:https://developer.nvidia.com/cudnn,(下载cudnn需要登录账号)
2.解压安装
下载之后进入压缩包所在文件夹,执行解压指令:
tar xvJf compiler-rt-3.9.0.src.tar.xz
在路径中生成cudnn-linux-x86_64-8.4.0.27_cuda11.6-archive文件夹,然后复制 lib64 和 include 文件夹到 /usr/local/cuda-11.3,命令如下:
sudo cp cudnn-linux-x86_64-8.4.0.27_cuda11.6-archive/include/cudnn.h /usr/local/cuda-11.3/include
sudo cp cudnn-linux-x86_64-8.4.0.27_cuda11.6-archive/lib/libcudnn* /usr/local/cuda-11.3/lib64
sudo chmod a+r /usr/local/cuda-11.3/include/cudnn.h /usr/local/cuda-11.3/lib64/libcudnn*
四、安装Anaconda
1.下载anaconda安装包
下载anaconda3镜像,清华大学开源软件镜像站下载地址: https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
也可以官网下载,下载地址:https://repo.anaconda.com/archive/
如果想下载特定对应python版本的可以参考官方在线文档Old package lists:https://docs.anaconda.com/anaconda/packages/oldpkglists/
本人下载的是:Anaconda3-2018.12-Linux-x86_64.sh
2.安装步骤
(1) cd进入Anaconda3-2018.12-Linux-x86_64.sh所在目录,也可以在目录中打开终端
bash Anaconda3-2018.12-Linux-x86_64.sh
(2) 然后一直回车键,直到出现
Please answer 'yes' or 'no'
输入 yes
(3) 之后就提示你要将Anaconda安装在目录/home/xxx/anaconda3下面:(建议使用此目录)
回车表示使用默认目录
或者输入自己想安装的目录,再回车
(4) 等待安装完之后,会询问是否把anaconda的bin添加到用户的环境变量中?
Do you wish installer to initialize Anaconda3 in your /home/xxx/.bashrc ? [yes|no]
输入yes
3.检查是否安装成功:
(1) 打开一个新的终端,输入python:
如果出现介绍了python的版本信息,而且后面带了anaconda的标识,这就说明Anaconda安装成功了,此时输入exit()退出python环境;
(2) 输入 conda --version:
之后输出conda 4.5.12 之类的版本信息,就说明环境变量设置成功了;
4.创建anaconda环境:
(1) 添加镜像源:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
(2) 创建环境
为便于项目环境管理,建议创建项目文件夹,并在项目文件夹内创建虚拟环境
# 创建项目文件夹
mkdir project
# 进入项目文件夹
cd project
# 创建虚拟环境
conda create -n your_env_name(你的环境名称) python=x.x(你需要的python版本)
(3) 激活环境
source activate your_env_name(你的虚拟环境名称)
或者 conda activate your_env_name(你的虚拟环境名称)
(4) 退出环境
source deactivate your_env_name
或者 conda deactivate your_env_name
(5) 安装,卸载包
(以numpy为例)
conda install numpy
conda uninstall numpy
注意事项:
在最新的anaconda安装后将其加入到bashrc中后,会默认自动激活基础环境
conda config --set auto_activate_base false
上面的命令就是将其自动激活的true更改为false,即可关闭虚拟环境,以后需要使用直接用命令行即可