环境:Centos 7
cuda11.8
python3.9
1、介绍:tensorflow从2.12版本后,不细分tensorflow-gpu版本,统一合成tensorflow。
2、pip安装tensorflow:pip install tensorflow
默认安装最高版本2.16,安装过程及其缓慢。
提前准备源:
清华大学源:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow
阿里云源:pip install -i https://mirrors.aliyun.com/pypi/simple/ tensorflow
然后再执行pip install tensorflow就会快很多。
3、安装完成后,坑来了
如下图:Could not find cuda drivers on your machine, GPU will not be used.
找不到cuda。
我的cuda环境变量配置正确,nvidia-smi都能显示,其他软件都能识别,tensorflow却找不到。
我耗费了一天的时间,查了好多资料,官网也没给出2.12之后的版本适配情况。终于在我一个个降版本的过程中试出来了,我从2.16降到2.15发现还不行,又降到2.14。。。尼玛,可以了。
好了,坑解决了。
原因就是2.15及以上版本,如果你是pip安装的,存在找不到cuda问题。当然从源码构建tensorflow的话,貌似可以,这个没有试过(官网有介绍)。
用2.14版本可以。虽然解决了GPU,还有一些库的问题需要解决。
继续降版本到2.13,上面找不到cuDNN等库的提示也不见了。
基本解决了。
但我程序跑过之后的GPU利用率很低,是怎么个回事?道阻且长啊。。。。。。