深度学习训练为了获取更高的性能,可以采用由粗到细的优化策略。比如使用缺省参数的Adam方法进行优化,在Adam训练结束后,性能无法进一步提升的基础上,继续使用SGD优化方法对权重调整,从而达到更优的分类性能。根据大量实践经验,SGD最后细化优化的效果最好!
分类训练举例,主要训练参数包括如下:batch size为32,使用分类交叉熵损失函数,使用Adam优化器,参数取系统缺省值,epochs设置为200,训练在连续10个epochs后loss不再减少停止训练,通过回调函数对loss最小的模型和对应的权重进行保存,Adam优化完成后,将最佳权重载入继续使用SGD优化器进行优化,momentum取0.9,学习率取0.0001,当连续15个epochs后loss不减少则停止最终的训练,此时的权重为最优的分类权重