最近因为疫情回不了学校,放血自费买了新装备做实验,配了一块2060的显卡,满心欢喜地在tensorflow上跑训练的代码,结果报错:ImportError: libcublas.so.9.0: cannot open shared object file: No such file。
好了,这就说明是cuda版本与tf不兼容了。
先说明一下环境,我是在conda创建的虚拟环境下运行的,python=3.6. 基本环境下cuda version = 9.2.
当时配置tensorflow的时候明明是按照cuda9.2装的tf1.8,怎么会不兼容???于是我 nvcc -V。
于是,我好奇的创建新虚拟环境安装tensorflow=1.8试试。
conda install tensorflow-gpu==1.8
看到报错,寻思着tf1.8确实是受不了cuda10+哈哈哈,我要确定一下cuda驱动版本。
nvidia-smi
原来cuda驱动是10.1,cuda版本和驱动版本不一致,尴尬了。原来新电脑的显卡驱动太新了。可参考英伟达官网的对应关系:
我错在cuda driver是430.64,却配置了cuda version=9.2. 好了,升级cuda版本吧,问题就解决了。当然tf要升级到2.0+了。