利用VGG16预训练模型微调网络时,遇到了模型不收敛的问题.记录一下!
第一次训练时参数设置如下:
batch_size = 64
lr = 0.00001
n_cls = 8
max_steps =30000
- 得到的训练集和验证集的loss 和 accuracy 结果如下:
从这四张图中可以明显地看到,模型没有收敛,而且模型的震荡很厉害,所以,这时候可以试着调整一下batchsize的大小,震荡比较大的时候可以增大batchsize的大小
-
第二次调整的参数如下:
batch_size = 128
lr = 0.0001
n_cls = 8
max_steps =30000
- 得到的训练集和验证集的loss 和 accuracy 结果如下:
可以看到,模型的精确度在训练集和验证集上的accuracy 都在90%以上.测试了一些图片,识别的还是不错的.
当模型波动比较大的时候,可以试着调大batchsize的值 !