caffe 训练模型心得

1.用caffemodel接着训练

训练squeezenet,第一版训了7000次,学习率0.01,感觉没有收敛,就用了最后得模型再开始训,第二次训练时发现学习率为初始化的值不是结束时得值,再训练过程中开始导致训练的acc降低,震荡较大。可能与学习率较大有关。学习率太大难收敛,太小收敛慢或者梯度消失无法学习。

batchsize太小易震荡,因为改变参数快,太大显卡遭不住,取数据慢!!

2.合适的范围内,学习率较大比较好,说明学习的东西要多一点,效果也要好一点。

初始值:学习率策略poly时,学习率初始0.001训练中收敛较快,后面学习效果几乎为0,到后面学习率在e-5左右,但效果不如初始大点儿的0.01。

               

策略:不比较每个策略的好坏,只从step为例,无论改变gamma值,即每次更改时的系数,还是改变stepsize,只要是使得学习率下降的慢一点的效果要好一点。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值