一、问题描述
刚配好CUDA + TensorFlow-GPU + Python环境,在编译器中运行时确报错
Could not load dynamic library 'libnvinfer.so.6'; dlerror: libnvinfer.so.6: cannot open shared object file: No such file or directory; LD_LIBRARY_PATH: :/usr/local/cuda-10.0/lib64
报错后仍可以正常运行,但是发现GPU并未调用,只跑在CPU上。在尝试多次重装CUDA10.0、CUDA ToolKit等后,均无效。
报错中还可能会提示缺失“TensorRT”;
二、原因分析
CUDA的Python相关库cudnn、cudatoolkit等没有安装全,并不是CUDA10.0等的锅(当然如果CUDA10.0等没有装也会有其他报错,而不是缺失库)
三、环境
Ubuntu+Python2.7+TensorFlow2.1.0
不管什么环境,出现此类报错解决的思路都类似。
四、解决方法
1.pip或者conda卸载掉所有的tensorflow包
2.如果没有安装CUDA等,先安装它们
3.用conda安装包
不要用pip安装TensorFlow包,要用conda来安装包(前提是要有Anaconda),输入conda指令:
conda install tensorflow-gpu==2.1.0
上面的版本可以换成2.0.0,无论什么版本切记一定要指明版本!否则可能会安装到1.0的旧版本。
conda会自动将TensorFlow相关的库给安装齐全,如cudnn、cudatoolkit、tensorflow-base等。
4.检查cudnn的版本是否与CUDA的版本相对应
参考下图:
5.此时再在编译器中运行环境,则不会有缺失文件的报错,且GPU开始有高占用率并正常工作
<该方法同样适用于解决TensorFlow只跑CPU不跑GPU的问题>
<该方法同样适用于如何配置TensorFlow与CUDA的问题>