转自:https://zhuanlan.zhihu.com/p/171703337
找了很多解决方案,一一试过,都没有成功,就在山重水复之时,看到了这篇博客,终于把问题解决了,所以转载一下,以备不时之需。多谢作者!!!
写在前面
用pycharm或jupyter notebook运行卷积神经网络时会出现问题:
Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
,其实还伴随着Could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR的问题,
还有之后的一些CUDA_ERROR_OUT_OF_MEMORY内存溢出的问题
解决方法:
- 方法一:网上大多的教程是说tensorflow的版本过高,或者说cuda和cudnn的版本不对,需要降级tensorflow为1.9,但实测发现这样会很麻烦,后续会带来很多问题。
- (推荐)方法二:其实显示了cudnn的问题,多半是由于显卡的显存爆了,此时我们只需在我们要执行的文件加入如下代码,即可:
import os
os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID"
os.environ['CUDA_VISIBLE_DEVICES'] = "0,1"//选择哪一块gpu,如果是-1,就是调用cpu
config = tf.ConfigProto()//对session进行参数配置
config.allow_soft_placement=True : 如果你指定的设备不存在,允许TF自动分配设备
config.gpu_options.per_process_gpu_memory_fraction=0.7//分配百分之七十的显存给程序使用,避免内存溢出,可以自己调整
config.gpu_options.allow_growth = True//按需分配显存,这个比较重要
session = tf.Session(config=config)
##或者
with tf.Session(config=config) as sess: