版本:tensorflow2.5 + CUDA11.2 + NVIDIA-SMI 472.19
报错代码
UnknownError: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
[[node model/conv2d/Conv2D (defined at Users\用户名\AppData\Local\Temp\ipykernel_24240\3644285622.py:37) ]] [Op:__inference_train_function_7180]
Function call stack:
train_function
跑深度学习的时候报错,这个问题网上的教程也说得很清楚,要么是CUDA,要么是显存。
CUDA的问题,除了版本确实安装得有问题,还要注意环境变量路径。
在我重新安装好所有版本后,版本都一致了,但是报错,然后检查发现是环境变量路径的问题,当系统内存在多个CUDA版本的时候,最新版本的路径会在旧版本之上,所以要确保自己想要使用的CUDA版本是当前路径。
系统属性-高级-环境变量-系统变量-PATH,看这里的路径,想要使用的CUDA版本是不是在最前面,选完记得逐个确定。
可以在终端用nvcc --version检查系统当前的CUDA是什么版本,像上图当前版本就是11.2。