tensorflow深度学习遇到各种疑难杂症,一律先考虑是不是工具包版本不匹配
安装正确对应版本的显卡驱动,python版本,cuda版本,cudnn版本,缺一不可,对应关系如下:
显卡驱动装最新版一般都没问题。
我遇到了几个问题包括:
1、训练第一个epoch很慢,要加载好几分钟,因为我是30系卡,原生之支持cuda11及cudnn8以上,低版本需要兼容,效率很低。
2、训练时jupyter notebook内核挂掉。
3、训练时gpu占用率为0。
以上问题在安装新版tensoflow和正确版本的工具包后一次性全部消失,最后分享一下我现在的工具包配置:
RTX3050 + python3.8 64位 + NVidia 516.59版驱动 + tensorflow2.9.0 + CUDA11.2 + cudnn8.1
顺便各个工具包官网链接附录:
cuda下载:CUDA Toolkit Archive | NVIDIA Developer
cudnn下载:cuDNN Archive | NVIDIA Developer
n卡驱动下载:官方 GeForce 驱动程序 | NVIDIA
python下载:Download Python | Python.org