一、Tensorflow2 GPU 安装方法
1. 首先安装Anaconda3环境
2. 在Anaconda Prompt 中安装tensorflow2
conda update conda
conda create -n tensorflow python=3.9
conda activate tensorflow
pip install tensorflow-gpu==2.7.0 -i https://pypi.mirrors.ustc.edu.cn/simple
pip install protobuf==3.19.6 -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn
# 找不到cuda Could not load dynamic library 'libcudart.so.11.0'
# 安装cuda的时候记得退出当前虚拟环境,不然还是会找不到cuda
conda install -c nvidia/label/cuda-11.6.1 cuda
https://zhuanlan.zhihu.com/p/483398695
which nvcc 查看是否安装好
接下来要做的很重要,在服务器上,我们自己安装的都在miniconda中
使用which nvcc 可以找到:
我们可以查看miniconda3路径下的lib,里面可以找到我们需要的cuda链接库
然后我们就可以去配置我们的路径了
vim ~/.bashrc #进入配置文件;
找个位置将下面两行插入进去就行:
export PATH=/mnt/sda3/home/XX/miniconda3/bin/:$PATH
export LD_LIBRARY_PATH=/mnt/sda3/home/XX/miniconda3/lib:$LD_LIBRARY_PATH
vim: i 插入 :wq 保存退出
然后更新配置:
source ~/.bashrc
再次激活环境,就不会有异常了:
当出现下面问题时,是还没有安装cudnn
Could not load dynamic library 'libcudnn.so.8'; dlerror: libcudnn.so.8: cannot open shared object file: No such file or directory;
cudnn 下载地址
https://developer.nvidia.com/cudnn
tar -xvf cudnn-linux-x86_64-8.9.5.29_cuda11-archive.tar
cp include/* miniconda3/include
cp lib/* miniconda3/lib
成功
3. 验证GPU是否可以使用
参考博客:https://blog.csdn.net/weixin_43412762/article/details/129824339
4. 错误解决
- 如果在训练时出现以下错误,需要重新安装其他版本的cuda,我是重新安装了cuda12的cuda.
tensorflow/stream_executor/gpu/redzone_allocator.cc:314] UNKNOWN: Failed to create a NewWriteableFile:
- 如果出现 I tensorflow/stream_executor/cuda/cuda_dnn.cc:366] Loaded cuDNN version 8500,然后程序终止了,提示缺少文件
按照图片进行配置,可以看到实际的报错是什么,会在输出中看到缺少安装zlibwapi.lib。
下面是链接
下载之后放在C:\Windows\System32中就可以了