在ST-GCN中,train model时出现的错误RuntimeError: CUDA out of memory
- 出现的具体问题如下图所示,在开始训练模型的第4个epoch跳出了RuntimeError的错误。在尝试使用少量的数据集(752MB)以及改小batch_size的前提下,仍然再第4个epoch终止后开始计算平均loss时,出现错误。苦思不得其解,于是遍览st-gcn的github的Issues,看到了这一个解决方法:
在“python main.py recognition -c config/st_gcn/ntu-xsub/train.yaml”此命令行后加上对test_bacth_size的限定,预留出存储空间,我也是抱着尝试的心态把命令行改为了“python main.py recognition -c config/st_gcn/ntu-xsub/train.yaml --test_batch_size 8”,结果证明该方法可行,如下图: