这段时间使用迁移学习的方法,使用VGG16模型训练自己的数据集,现将在训练过程中遇到的问题记录下来:
1、不改变VGG16模型的网络结构,来训练自己的数据集。这部分都是照着网上一步一步来,没有什么大的问题,就是要特别要注意base_lr(学习率的设置),这个设置的不对在训练过程中会出现不收敛的情况。
2、改变VGG16模型,来训练自己的数据集。这个时候可以使用迁移学习也可以不使用迁移学习,使用不适用迁移学习主要是在vgg_train.bat中是否有--weights=C:/caffe/caffe-master/examples/vggface/VGG_FACE.caffemodel此行代码。这部分我依然使用的是迁移学习的方法,这个时候一定明白在训练的过程中你的训练次数时候足够,我用的是小样本进行训练,总共是200张照片一共40个人,batch_size设置为3,max_iter最大迭代次数为600,训练后准确率一直很低而且loss值一直下不去。之后看了一些文章和问问同学后发现是我的batch_size设置的太小,这就相当于我只训练个1800张照片这是远远不够的。
关于batch_size的介绍可以看看这篇文章:https://blog.csdn.net/xuxiatian/article/details/72649901