Rethinking ImageNet Pre-training

最新推荐文章于 2022-04-24 11:43:40 发布

watersink

最新推荐文章于 2022-04-24 11:43:40 发布

阅读量1.1k

点赞数 2

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_14845119/article/details/84563493

版权

深度学习专栏收录该内容

49 篇文章 6 订阅

订阅专栏

论文：Rethinking ImageNet Pre-training

Github：https://github.com/facebookresearch/Detectron

恺明大神一作的论文，必读的论文。

贡献：

ImageNet 预训练可以加速收敛，尤其是在训练早期，但是随机初始化训练在经过更多次的迭代后，也可以达到相同的精度。
ImageNet 预训练并没有增加更好的正则化
ImageNet 预训练对于检测任务没有任何帮助

论文颠覆了传统的预训练，微调的思想，然后提出了随机初始化训练也可以达到同样的精度。并实验进行了验证。包括下面3种方式都取得了和预训练一样的精度。

只使用10%的训练数据
使用更深更宽的模型
多任务训练和度量

2点训练改进：

使用Group Normalization (GN) 归一化方法，因为对于检测任务的训练，每个显卡能吃的图片很少，BN对batchsize要求较大，但是GN对batchsize不敏感。
使用异步BN,Synchronized Batch Normalization (SyncBN) ，将多机器多卡的图片计算BN。

实验结果：

总结：

不需要网络结构的改变，就可以在目标任务上随机初始化训练
随机初始化训练需要更多的迭代才能保证收敛
即使只使用1/10的训练数据，训练结果精度也不会比使用ImageNet预训练的结果精度要差
ImageNet预训练可以加快在目标任务的收敛
ImageNet预训练不能减少过拟合，除非在很少的目标数据集上
ImageNet预训练对分类任务比对检测任务帮助的多
Is ImageNet pre-training necessary? No
Is ImageNet helpful? Yes
Do we need big data? Yes
Shall we pursuit universal representations? Yes

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Rethinking ImageNet Pre-training

论文：Rethinking ImageNet Pre-training Github：https://github.com/facebookresearch/Detectron 恺明大神一作的论文，必读的论文。贡献：ImageNet 预训练可以加速收敛，尤其是在训练早期，但是随机初始化训练在经过更多次的迭代后，也可以达到相同的精度。 ImageNet 预训练并没有增加更...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。