正常安装Ubuntu18.04/20.04后,开始RandLA-net算法网络的复现,开始环境搭建。
环境:Ubuntu18/20;RTX3080 ;cuda11.4;cudnn8.2.2.26;anconda3-2019-10;
python3.6;tensorflow2.6,nvidia显卡驱动470 。
Ubuntu18.04或者Ubuntu20.04任选一 —> 搭配cuda11.4或者cuda11.3任选一 --> 配合tf2.6都是可以的,博主装了几遍系统都亲测过,不过cuda和cudnn安装的版本要和ubuntu版本对应。
1.换源:
先执行一遍:
sudo apt-get update
换成清华源并执行
再执行:
sudo apt-get update
2.验证系统是否安装了gcc
在终端中输入:
gcc -v
结果显示:
Command 'gcc' not found, but can be installed with: sudo apt install gcc
则没有安装
若未安装请使用下列命令进行安装:
sudo apt-get install build-essential
3.如果没有装英伟达的显卡驱动,先装驱动,有了直接下一步:
选择470 ---应用更改---重启
4.查询驱动支持的最高cuda
nvidia-smi
可以看到右上角为cuda11.4
5.下载cuda安装包:cuda官网下载,根据系统信息选择对应的版本。
CUDA版本下载页面:
https://developer.nvidia.com/cuda-toolkit-archive
选择需要下载的CUDA版本,根据页面提示,选在对应的系统、平台等选下,选择deb或者runfile类型安装文件,个人选择runfile安装文件。runfile安装的话最后一项要选择 runfile文件。
下载到家目录。
6.配置好后再安装
二、禁用nouveau
Nouveau是由第三方为NVIDIA显卡开发的一个开源3D驱动,让Linux更容易的应对各种复杂的NVIDIA显卡环境,安装完Linux系统即可进入桌面并且有不错的显示效果,所以,很多Linux发行版默认集成了Nouveau驱动,在使用NVIDIA显卡时默认安装Nouveau驱动。但是用户除了想让正常显示图形界面外很多时候还需要一些其他功能,Nouveau驱动不能完成,同时还会对安装其他插件造成干扰。因此需要禁用。
终端输入:lsmod | grep nouveau
发现什么都没有返回,则自己禁用,无需在操作这一步。
若有,则采用黑名单的方式来禁用nouveau
在终端输入:
sudo gedit /etc/modprobe.d/blacklist-nouveau.conf
在打开的文件中添加:
blacklist nouveau
options nouveau modeset=0
保存修改内容,在终端中输入:sudo update-initramfs -u
再输入:reboot
这是重启命令,重启后在终端输入:lsmod | grep nouveau
发现什么都没有返回,这说明禁用成功。
7.操作
切换到cuda安装文件的路径:
cd /home/
sudo sh cuda_11.4.3_470.82.01_linux.run
按照提示一步步操作,选择---continue---accept---按【回车】叉掉驱动即第一个,因为已经安装过了---install
图
图
安装成功后,会显示installed,否则会显示failed。
''' 此 为 注释不用看和操作 命令行安装模式
8.测试安装
cat /usr/local/cuda/version.json
查看安装的版本信息。可以通过运行samples下的程序检查是否安装有效,如下
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make ./deviceQuery
./deviceQuery
进入目录,编译生成程序,然后运行程序。出现类似如下的信息:
最后显示结果 Result = PASS,表示安装成功。
9.进行环境配置,把CUDA相关命令和库文件添加到系统目录中。不然有些情况会出现找不到命令(如nvcc)或者库的问题。
sudo gedit /etc/profile
修改profle文件,这个是对所有用户有效,如果仅对当前用户,则修改~/.bashrc文件。在最后部分加上:
export PATH="/usr/local/cuda/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda/lib64:$LD_LIBRARY_PATH"
然后运行
source /etc/profile
使更改生效,之后运行
nvcc -V
重启sudo reboot
就能够显示安装的CUDA版本信息。
CUDA安装成功。
10.cudnn安装
从cuDNN下载链接
cuDNN Archive | NVIDIA Developer
下载对应的cuDNN的版本。(这里要是20.04的版本就下20.04的cudnn)
可以只用安装runtime版本就行,可以同时安装Developer Library和Code Samples,这种方式的好处是包含了示例程序(Code Samples)的安装,可以用来测试cuDNN的正常工作。
分别下载上述的deb文件,之后依次进行安装
sudo dpkg -i libcudnn8_8.2.2.26-1+cuda11.4_amd64.deb
sudo dpkg -i libcudnn8-dev_8.2.2.26-1+cuda11.4_amd64.deb
sudo dpkg -i libcudnn8-samples_8.2.2.26-1+cuda11.4_amd64.deb
11.cudnn测试
cuDNN的示例程序会产生在/usr/src/cudnn_samples_v8目录,可以拷贝目录至用户自己的目录进行测试,如下:
cp -r /usr/src/cudnn_samples_v8 .
然后用其中的mnist示例进行测试:
cd cudnn_samples_v8/mnistCUDNN
进行编译
make
其中如果出现缺少FreeImage.h头文件的错误,这是因为没有安装freeimage的库。
另开终端进行如下安装
sudo apt install libfreeimage3 libfreeimage-dev
再进行make就可以通过。之后运行
./mnistCUDNN
出现如下类似字符信息:表示测试通过安装成功
12.conda配置
anaconda 是一个python的发行版,包括了python和很多常见的软件库, 和一个包管理器conda。
安装Anconda3:
通过访问上面这个地址:
https://repo.anaconda.com/archive/
可以下载历史版本的Anaconda,我使用的是Anaconda3-2019.10-Linux-x86_64.sh
进入到下载Anaconda3-2019.10-Linux-x86_64.sh安装包所在的目录。
打开终端,运行:
bash Anaconda3-2019.10-Linux-x86_64.sh
然后一直按回车,遇到“yes/no" 就 "yes" 在回车,最后选yes初始化。
这样就会安装好anaconda了,然后重新启动一下电脑!
13.测试安装:
打开一个新的终端,输入python:
含有python的版本信息,而且后面带了anaconda的标识,这就说明Anaconda安装成功了,此时输入exit()退出python环境。
输入 conda --version 或者conda -V,可以看到版本信息。
还有就是,在没有安装anaconda之前,我们输入:which python
查看python的原生默认安装路径为:/usr/bin/python
而安装了anaconda之后,再次输入:which python
会改变为:/home/【用户名】/anaconda3/bin/python
说明环境变量设置成功了。
为了避免可能发生的错误, 先把所有工具包进行升级,命令行输入:
conda upgrade --all
这样整个anaconda就安装成功了。
14.使用anaconda创建python环境的方法:
终端执行:
conda create -n 环境名称 pytohn=3.6
创建环境即可。
15.进入创建的环境:
conda activate 环境名称
16.进入环境后安装tensorflow:tensorflow-gpu 2.6安装:
pip install tensorflow-gpu==2.6 -i Simple Index --timeout=120
15.至此环境配置完毕!!!感谢大佬指引!!!
参考链接:
Ubuntu 18.04安装CUDA 11.4.3和cuDNN 8.2.4_星光-CSDN博客
ubuntu安装cuda教程详解_RealCoder的博客-CSDN博客_ubuntu安装cuda
linux命令行安装cuda,Ubuntu16.04上安装CUDA9.0 详细教程_weixin_39580715的博客-CSDN博客 Ubuntu18.04 安装 Conda环境_mmmm223的博客-CSDN博客_ubuntu18.04安装conda