torch.backends.cudnn.enabled = False
禁用cuDNN可能会导致模型的训练和推理速度变慢,因为cuDNN是专门设计用于加速深度神经网络计算的库。
因此,在决定禁用cuDNN之前,应该权衡性能和稳定性之间的权衡。
偏大 | 偏小 | |
epoch | 过拟合 | 未能完全收敛 |
batchsize | 占用更多的内存、训练过程不稳定或陷入局部最优 | 慢、噪声较大,使模型难以收敛 |
learningrate | 收敛速度快,但可能发生不稳定或无法收敛 | 收敛慢,稳定性高 |
噪声是指由于样本的随机性和参数的随机初始化等因素引入的不确定性。导致训练中损失函数的值在训练过程中会有一定的抖动。
batchsize=32和128的示例: