linux服务器配置cuda&cdunn
CUDA:将代码放到gpu上
cudnn:优化gpu的计算能力,跑代码更快
一,选择正确的版本号
tensorflow
、cudnn
和CUDA
的版本号一定要对上- 先在服务器上检查显卡信息和
CUDA
版本号(CUDA Version: 11.0)
nvidia-smi
- 然后上网查一下具体的
tensorflow
和cudnn
与CUDA
对应的版本号,网址在此-对应表 - 我的配置
- tensorflow-2.4
- CUDA-11.0
- cudnn-8.0
- 先在服务器上检查显卡信息和
二,配置并安装anaconda3
- 去官网下载一个linux的安装文件以
.sh
为文件拓展名 (官网:anaconda官网) - 把它上传到服务器
- 安装它
bash filename.sh
- 配置环境
vim /etc/profile # 在文件底部添加 export PATH=$PATH:/anaconda3/bin
- 添加channels
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/conda-forge/ conda config --set show_channel_urls=True #设置不自动进入base环境 #conda config --swt auto_activate_base=False
三、配置tensorflow、CUDA和cudnn
- 直接用conda安装
conda install -n envname cudatoolkit=11.0 conda install -n envname cudnn=8.0 conda install -n envname tensorflow-gpu=2.4 #当然还要一些别的需要的一些库
- 安装好之后还要跳过sudo权限,删掉一个文件(实际上是哪报错删哪)
rm -rf /anaconda3/envs/envname/lib/python3.8/site-packages/tensorflow/core/kernels/libbtfkernel_sobol_op.so
- 要检查一下,到底删了没,
cd
进去看看
四,怎么用gpu跑代码(tensorflow)
- 在代码里加入
tf.device('/gpu:num')#num是nvidia-smi里使用率小的显卡编号
- 通过CUDA_VISIBLE_DEVICES指定
import os #num1、num2同上,可多可单 os.environ['CUDA_VISIBLE_DEVICES']='num1,num2'
- 还可在终端指定
CUDA_VISIBLE_DEVICES=num python train.py