caffe 训练之学习率

今天,自己在用caffe训练alfw的pose数据集时,使用欧几里得loss回归,发现测试的每张图片经过训练的网络,得到的回归值几乎全都一样。刚开始以为数据错了,于是在caffe的data_layer层中将读入的值打印出来,发现没问题;继续将欧几里得loss层的两个bottom输入的值也打印出来,发现在经过几千次迭代后,验证集的预测值几乎都一样,一点点查原因。网络结构、数据都没问题,但是这个现象说明网络根本就没怎么学习,于是看了solver.protxt里面的几个参数,学习率设为0.0001,太小,改成0.01重新训练,刚才的现象没了,而且loss下降的也很快。通过这次,自己也总结了一下caffe训练时,一开始可以把学习率适当调高些,取0.01时比较合适,然后看训练和测试的loss,如果收敛了而且有继续下降的趋势,可以降低学习率继续训,这样模型比一开始就把学习率设那么小效果要好得多。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值