trian和val结果相差很大。

Snoopy_Dream

于 2018-12-15 22:29:46 发布

阅读量3k

点赞数 1

我说的是如果你含有BN层的话，有些人选择把BN层去掉之后，发现trian和val相差不大了。

存在的问题：对训练集 accuracy可达0.99 loss=1e-2 -3，然而验证集 accuracy 0.5，loss 很高，试了多个初始学习率（0.1 — 0.0001）都不行

解决上述问题： 采取warm up方法，对上述问题有点帮助,或者换成SN层，但是显存会增大很多。

训练resnet，由于不finetune，很容易过拟合，paper《Deep Residual Learning for Image Recognition》中对cifar10的实验用了一个trick是 warm up（热身），就是先采用小的学习率（0.01）进行训练，训练了400iterations之后将学习率调整至0.1开始正式训练。

一开始不以为然，我分别用了四个初始学习率 lr=0.1; 0.01; 0.001; 0.0001; 然后每1000个iterations就降低一次lr。然而这四种初始学习率都试过之后，发现，验证集的accuracy怎么都上不去，都是0.5~0.6之间，而训练集的可以到0.99。而resnet采用了batch normalization,在caffe中，batch normalization 就有一个“坑”，就是use_global_stats 的设置问题。training时候是关闭，testing的时候是要打开，deploy也是要打开的。
对于训练集accuracy达0.99，验证集accuracy是0.5+的情况，我以为是batch normalization出问题，于是乎各种捣鼓BN去了，最后试了一下warm up，网络在验证集的loss才有所下降。

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
trian和val结果相差很大。

我说的是如果你含有BN层的话，有些人选择把BN层去掉之后，发现trian和val相差不大了。存在的问题：对训练集 accuracy可达0.99 loss=1e-2 -3，然而验证集 accuracy 0.5，loss 很高，试了多个初始学习率（0.1 — 0.0001）都不行解决上述问题：采取warm up方法，对上述问题有点帮助,或者换成SN层，但是显存会增大很多。训练resn...
复制链接

扫一扫

Snoopy_Dream CSDN认证博客专家 CSDN认证企业博客

码龄9年

120: 原创

3万+: 周排名

95万+: 总排名

63万+: 访问

: 等级

6727: 积分

709: 粉丝

568: 获赞

218: 评论

2232: 收藏

私信

关注

热门文章

分类专栏

最新评论

cascade rcnn检测代码
sevenday826: 博主，cascadercnn_voc_iter_35000.caffemodel是什么文件呀
PyTorch 更改训练好的模型继续训练
谙305: 你好，这个冻结部分，怎么加载预训练的参数并冻结呢
目标检测训练数据旋转python代码——数据增广（一）
远方上鸭: 你好，博主，我最近也在摸索cascade rcnn这个模型，请问博主可以分享一下复现的模型代码吗？我在GitHub和gitee上找到的代码都因为时间过早导致不能正常运行，没办法解决，真的谢谢啦
cascade rcnn 训练自己的数据——（一）转换数据
远方上鸭: 你好，博主，我最近也在摸索cascade rcnn这个模型，请问博主可以分享一下复现的模型代码吗？我在GitHub和gitee上找到的代码都因为时间过早导致不能正常运行，没办法解决，真的谢谢啦
nn.moduleList 和Sequential由来、用法和实例 —— 写网络模型
溯水襄陵_: 构建比较复杂的模型时候，需要从底层到高层，先部分后总体来构建，将这些不同部分组合到一起时候，我发现nn.Sequential()和nn.ModuleList()更好理解，反而class MyModule(nn.Module):和其中的forward()会让人突发困惑

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。