关于TensorFlow-GPU的一些坑(持续更新)

      TensorFlow的GPU版本相比于CPU版本,不管是安装还是使用阶段,总是会出现各种各样意想不到的错误,这几天就碰到的问题说一说。

1. 训练集精度提高,测试集精度不变。

同样的程序(https://github.com/azy1988/ML-CV/tree/master/MSTAR_ATR),详细内容可参考https://blog.csdn.net/zhenyu_an/article/details/88621702,在我的台式机(Intel Core I5 6500,显卡GTX 960,TensorFlow-GPU 1.2.1,keras 2.1.2)可以完美运行(4至5个epoch之后测试精度开始提高,大约在40个epoch后达到0.99的水平)。后来在我的一台笔记本(Intel i5-8300H,显卡GTX1060,TensorFlow-GPU 1.8.0,keras 2.2.4),则出现了训练loss逐渐减小,训练精度acc提高,但validation的精度始终维持在0.8227,经过20多个epoch不变化的情况。

       解决办法:

       一般情况下,测试集正确率不变是因为模型过拟合,但经过反复确认,程序、模型没有问题,突然想起来之前也碰到过类似问题,在更改TensorFlow版本之后变好,于是试着把TensorFlow版本降为1.5.0,竟然就正常跑了。

2. pip list中的AttributeError: _version ValueError: ("Missing 'Version:' header and/or METADATA file", Unknown [unknown version]问题。

       解决办法:

这个问题是因为我在不停安装卸载升级TensorFlow时出现的问题,报错是因为版本太多,产生了一些多余文件,导致pip识别不出正确的tf版本。解决方法是参考博客:https://blog.csdn.net/caesarhtx/article/details/86707657,删去了-ensorflow和-ensorflow_gpu-1.2.0.dist-info这两个文件夹,安装合适版本的tf之后正常了。

3. 在做dcgan时候,生成式模型中的upsampling2D函数出错。在TensorFlow-gpu版本为1.7.0时候,对于输入为(None, 7, 7, 256)的矩阵,进行上采样,结果为(None, 7, 14, 512),并不是预想的(None, 14, 14, 256)。猜测是tf版本不同所导致的结果,因此卸载已安装的tf-gpu1.7.0,重新安装tf-gpu1.5.0后解决问题。

4. 碰到TensorFlow-gpu版本之后,import TensorFlow时候出现“ImportError: DLL load failed: 找不到指定的模块”的错误。这个是因为电脑本身没有安装对应的vs版本导致,建议在这个网址下载Microsoft Visual C++ 2015 Redistributablehttps://www.microsoft.com/zh-CN/download/details.aspx?id=48145

5. ModuleNotFoundError: No module named ‘_pywrap_tensorflow_internal’的错误,这个也是tf版本不合适导致的,降版本至1.5.0解决。具体原因可以参考blog https://blog.csdn.net/gaofeipaopaotang/article/details/80540721

6. 在windows操作系统安装tf时候,不建议直接用 pip install tensorflow-gpu指令,最好在国内的镜像网站,如豆瓣镜像https://pypi.doubanio.com/simple/中直接下载合适版本的whl文件,然后pip安装,速度快,版本可控。

总结一下,tf-gpu的版本继承性不是很好,一味安装高版本不见得是好事,为了解决版本的问题,我从tf-gpu的1.1.0一直尝试到1.5.0,对于gtx1060才算是比较完美运行。因此,如果你的程序有些诡异的问题,特别是已经证明正确的程序在你的电脑上报错,那首先可以考虑降低tf-gpu版本了。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值