在使用Ag的TensorFlow2.0教程时,发现在模型训练时报错Blas GEMM launch failed
两幅图中间还有一些报错,都是Keras库里函数的报错。
问题原因:
Tensorflow默认申请可使用的全部显存,当有两个程序使用GPU时,会出现空间不足的问题。在这里是我没有“关闭”另一个运行中的训练进程。使用nvidia-smi命令可在cmd中看到使用gpu的进程有两个,因为我之前另一个jupyter页面也跑过训练,直接关了页面,但是没想到进程还在。
解决方法:
在jupyter页面上退出时,要点击shutdown,这样才能将页面运行的进程杀掉,单纯关闭网页是不能关掉进程的。如图,这样就可以愉快地打开另一个训练进程了
参考: