tensorflow卷积报错Failed to get convolution algorithm. This is probably because cuDNN failed t

最新推荐文章于 2021-11-25 11:13:19 发布

集电极

最新推荐文章于 2021-11-25 11:13:19 发布

阅读量4.6k

点赞数 11

分类专栏： python随笔 BUG

本文链接：https://blog.csdn.net/qq_38463737/article/details/118497494

版权

tensorflow python

python随笔同时被 2 个专栏收录

87 篇文章 26 订阅

订阅专栏

BUG

55 篇文章 0 订阅

订阅专栏

tensorflow卷积报错Failed to get convolution algorithm. This is probably because cuDNN failed t

说明：环境是tensorflow,测试GPU没有问题。

在tensorflow2.0和tensorflow1.15我都有遇到这个错误，主要是显卡内存分配问题。

但在运行模型出现错误。

UnknownError: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above. [Op:Conv2D]

解决方法添加下面两行

import os

os.environ['CUDA_VISIBLE_DEVICES'] = '/gpu:0'  # 运行程序，都会占用gpu0全部资源

# 多个GPU时，如果运行只使用了一个的话，可以设置为‘/gpu:0,1’等等


# 另一种写法
os.environ['CUDA_DEVICE_ORDER'] = 'PCI_BUS_ID' # 按照PCI_BUS_ID顺序从0开始排列GPU设备
os.environ['CUDA_VISIBLE_DEVICES'] = "0,1" #设置当前使用的GPU设备为0,1号两个设备,名称依次为'/gpu:0'、'/gpu:1'。
#[0,1]和[1,0]排列的设备是不同的，排在前面的设备优先级高，运行程序的时候会优先使用。

其他一些解答（我测试没有成功，但可能是我遇到的情况不一致）

1.矛头指向了是因为显存分配没搞好造成的

解决代码

import tensorflow as tf
config = tf.compat.v1.ConfigProto(allow_soft_placement=True)
config.gpu_options.per_process_gpu_memory_fraction = 0.8
tf.compat.v1.keras.backend.set_session(tf.compat.v1.Session(config=config))

来分析一下这段代码以及问题原因：
众所周知，keras以TensorFlow做后台时，TensorFlow会默认吃掉所有可用的显存（即便此时没有用到做计算，这些显存也会显示占用来待命）

第二行的0.3，意思是限制每个模型只能分配30%的显存，不允许吃掉所有。当然这是理论值，当实际开始计算时，如果需要，依然可以超出这个理论值。

2 也是说显卡内存分配问题

from tensorflow.compat.v1 import ConfigProto
from tensorflow.compat.v1 import InteractiveSession

config = ConfigProto()
config.gpu_options.allow_growth = True
session = InteractiveSession(config=config)

这个设置为按需分配

集电极

关注

11
点赞
踩
17

收藏

觉得还不错? 一键收藏
9
评论
tensorflow卷积报错Failed to get convolution algorithm. This is probably because cuDNN failed t

tensorflow2.0卷积报错Failed to get convolution algorithm. This is probably because cuDNN failed t说明：环境是tensorflow2.0.0,测试GPU没有问题。但在运行模型出现错误。UnknownError: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try lookin
复制链接

扫一扫

专栏目录