1、加载数据集的时候出现错误:
ImportError: DLL load failed: 找不到指定的模块。
ImportError: numpy.core.multiarray failed to import
在网上查找到的原因是:由于numpy的版本问题
查看numpy版本命令:
pip show numpy
查看结果如下图:numpy版本为1.18.2
numpy版本需要改为: 1.16.4
首先卸载numpy:
pip uninstall numpy
然后再下载numpy 1.16.4版本:
pip install numpy==1.16.4
查看numpy版本如图:
参考链接:【python】踩坑:ImportError: numpy.core.multiarray failed to import
2、报错:ResourceExhaustedError: OOM when allocating tensor with shape[3,3,512,512]
原因:数据太大,不能一次放入GPU中
解决方法:
1、减少Batch 的大小
2、分析错误的位置,在哪一层出现显卡不够,比如在全连接层出现的,则降低全连接层的维度,把2048 改成1042啥的
3、增加pool 层,降低整个网络的维度。
4、修改输入图片的大小
5、采用CPU进行训练:os.environ["CUDA_VISIBLE_DEVICES"] = "-1"
3、报错:
tensorflow.python.framework.errors_impl.UnknownError: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above. [Op:Conv2D]
原因:
1、cuda和cudnn不匹配
2、电脑GPU性能不足
解决方法:假若训练模型不大的话,采用CPU进行训练即可:
#选择哪一块gpu--->值为-1就是说不用GPU了,直接使用CPU计算
os.environ["CUDA_VISIBLE_DEVICES"] = "-1"
参考博客:TensorFlow: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize