问题:CNN训练中断,使用checkpoint继续训练时性能差异大。
方法:设置生成随机数的种子
torch.manual_seed(args.seed)
np.random.seed(args.seed)
random.seed(args.seed)
torch.cuda.manual_seed_all(args.seed)
torch.backends.cudnn.deterministic = True
torch.backends.cudnn.benchmark = False
同一网络每次训练后loss或精确度差异大,也可能是没有设置固定的随机数种子。