caffe 训练之学习率

最新推荐文章于 2019-11-13 11:54:16 发布

xjc864588399

最新推荐文章于 2019-11-13 11:54:16 发布

阅读量3k

点赞数

分类专栏：深度学习文章标签： caffe 图片

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xjc864588399/article/details/54024021

版权

深度学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

今天，自己在用caffe训练alfw的pose数据集时，使用欧几里得loss回归，发现测试的每张图片经过训练的网络，得到的回归值几乎全都一样。刚开始以为数据错了，于是在caffe的data_layer层中将读入的值打印出来，发现没问题；继续将欧几里得loss层的两个bottom输入的值也打印出来，发现在经过几千次迭代后，验证集的预测值几乎都一样，一点点查原因。网络结构、数据都没问题，但是这个现象说明网络根本就没怎么学习，于是看了solver.protxt里面的几个参数，学习率设为0.0001,太小，改成0.01重新训练，刚才的现象没了，而且loss下降的也很快。通过这次，自己也总结了一下caffe训练时，一开始可以把学习率适当调高些，取0.01时比较合适，然后看训练和测试的loss，如果收敛了而且有继续下降的趋势，可以降低学习率继续训，这样模型比一开始就把学习率设那么小效果要好得多。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

xjc864588399 CSDN认证博客专家 CSDN认证企业博客

码龄10年

82: 原创

20万+: 周排名

103万+: 总排名

9万+: 访问

: 等级

1679: 积分

5: 粉丝

10: 获赞

22: 评论

40: 收藏

私信

关注

热门文章

分类专栏

论文翻译 2篇
机器学习 3篇
计算机视觉 3篇
opencv
深度学习 10篇
caffe 7篇
python 脚本 6篇
shell 4篇
Android开发 5篇
算法 46篇
leetcode 34篇
C++ 8篇
ios 1篇
python 4篇
torch 2篇
数据库
Latex 2篇
tensorflow 1篇

最新评论

深度学习之多任务训练
农夫山泉2号: 你的loss不整合吗？
深度学习之多任务训练
懒懒妞: 楼主可以分享一下您的代码吗？我的邮箱是273856942@qq.com
50 行 PyTorch 代码搞定 GAN
乒乒乓乓丫: 谢谢博主，正好这段之前不怎么明白
50 行 PyTorch 代码搞定 GAN
吃块沙琪玛: 使用data+diffs的解释确实是使得输入维度变高了，但是前100维度的原始数据和后100维度的diff数据是不同的，正常深度学习都会进行一次规范化，但这里没有使用规范化，却使得输出更逼真。。。
深度学习之多任务训练
爱学习的火龙果: 谢谢了

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。