1.test_iter=n,该参数表示 需要测试迭代的次数n。
test_iter* batchsize(测试集的)=测试集的大小
2.test_interval=n,该参数表示 训练的时候,每迭代n次就进行一次测试。
3.lr_policy,该参数表示 caffe进行深度学习时的学习策略,具体有:
base_lr: 0.01
lr_policy: "fixed"
max_iter: 400000
等,具体可以参考,https://blog.csdn.net/cuijyer/article/details/78195178
4.momentum,该参数表示 梯度下降参数。
5.weight decay,该参数表示 权值衰减参数。目的是防止过拟合。在损失函数中,weight decay是放在正则项(regularization)前面的一个系数,正则项一般指示模型的复杂度,所以weight decay的作用是调节模型复杂度对损失函数的影响,若weight decay很大,则复杂的模型损失函数的值也就大。
6.clip_gradient,该参数表示 权重更新的范围。它的引入是为了处理gradient explosion的问题。当在一次迭代中权重的更新过于迅猛的话,很容易导致loss divergence。clip_gradient 的直观作用就是让权重的更新限制在一个合适的范围。