问题汇总
1.cpu版性能比较慢,模型压缩
2.sgd训练后,训练准确率比较高,测试时,训练和测试准去率都特别低
3.单机多gpu训练,有的权重不能预测,精度比单机单gpu低。
问题:每次训练开始几个batch的recall特别低,
原因是shuffle=False,改为True即可,正常情况下,recall是一直增加的
问题汇总
1.cpu版性能比较慢,模型压缩
2.sgd训练后,训练准确率比较高,测试时,训练和测试准去率都特别低
3.单机多gpu训练,有的权重不能预测,精度比单机单gpu低。
问题:每次训练开始几个batch的recall特别低,
原因是shuffle=False,改为True即可,正常情况下,recall是一直增加的