图像分类训练tricks

最新推荐文章于 2024-07-18 11:05:47 发布

你电吴彦祖

最新推荐文章于 2024-07-18 11:05:47 发布

阅读量706

点赞数 1

分类专栏：模型训练文章标签：深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Passenger_zhang/article/details/113819552

版权

本文介绍了图像分类训练中的各种技巧，包括优化器的选择（如SGD和Adam），学习率和学习率下降策略，weight_decay的调整，label_smoothing的应用，以及数据增强的各种方法（如AutoAugment、RandAugment、cutout等）。这些技巧对于提高模型的精度和防止过拟合具有重要作用。

摘要由CSDN通过智能技术生成

图像分类训练tricks

本文简单整理了一些图像分类训练tricks，后续可能会陆续加以补充。

1. 优化器

带momentum（=0.9）的SGD优化器的使用最多，收敛精度常常更好，但收敛速度慢，初始学习率设置要靠经验设置（参考值0.1）。

自适应优化器Adam、RMSProp、Adamw等收敛精度稍差，但收敛速度更快更稳定，Adam学习率参考值1e-4.

AdaBound在某些任务上数据集上，收敛速度可媲美Adam，收敛精度可媲美SGD，调节参数更少。

2. 学习率及学习率下降策略

SGD一般配合分段衰减策略piecewise_decay，例如初始学习率设为0.1，每30个epoch下降为原来的1/10

Adam等优化器可搭配余弦衰减策略cosine_decay，因学习率小的epoch较少，故最终模型精度欠佳，所以建议增加训练epoch

Batchsize增大时，线性增大学习率，可使收敛精度几乎不受影响

warmup 训练初期不宜使用较大的学习率，可采用warmup策略，在batch_size较大时，效果明显。结合cosine_decay，可采用带有warmup的cosine_decay策略。

2. 1 选择合适的学习率

利用一个epoch来获取学习率。首先设置一个非常小的学习率，对每个batch数据训练后，对初始学习率乘上一个常数，记录每个batch后的loss。根据一个epoch内的loss画图

最低0.47元/天解锁文章

你电吴彦祖

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
图像分类训练tricks

图像分类训练tricks1. 优化器2. 学习率及学习率下降策略2. 1 选择合适的学习率3. weight_decay4. label_smoothing5. 通过验证集和测试集的准确度确定调优策略6. 数据增强6.1 图像变换类6.2 图像裁剪类6.3 图像混叠类7. 参考资料本文简单整理了一些图像分类训练tricks，后续可能会陆续加以补充。1. 优化器带momentum（=0.9）的SGD优化器的使用最多，收敛精度常常更好，但收敛速度慢，初始学习率设置要靠经验设置（参考值0.1）。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。