图像分类性能提升方案

最新推荐文章于 2022-10-28 09:43:38 发布

龙海L

最新推荐文章于 2022-10-28 09:43:38 发布

阅读量992

点赞数

分类专栏：技巧图像处理 pytorch 文章标签：深度学习图像分类计算机视觉算法 python

本文链接：https://blog.csdn.net/qq_36523203/article/details/107608284

版权

文章目录

数据
模型
损失函数
评估+错误分析

方法技巧关注方向主要为三个方面，数据，模型和损失函数。

数据

EDA（探索性数据分析）

图像预处理

1.mixup

论文：https://arxiv.org/pdf/1801.02929v2.pdf
代码：https://github.com/hongyi-zhang/mixup
开源代码中采用的是一个dataloader，和论文中说的两个DataLoader不一致，下面是代码的基本流程。
1.定义mixup的形式。在每个batch中的操作
在这里插入图片描述
2，论文中实验流程和结果：
图像分类实验：
mixup实质是为数据提供了更加平滑的干扰因素。在数据集ImageNet2012上，mixup的图像效果如下：

和ERM进行了比较，参数保持在[0.1,0.4]之间，基本都要比ERM提高了至少一个百分点。
参数的值对应的取值分布：
在这里插入图片描述
对于mixup，我们发现，与ERM相比， $\alpha$ ∈[0.1,0.4]能够提高性能，而对于较大的 $\alpha$ , mixup会导致欠拟合。我们还发现，具有较高能力和/或较长训练时间的模型在混合中受益最大。例如，当训练90个epoch时，ResNet-101和ResNeXt-101的混合变体相比ERM类似物获得了更大的提高(0.5%到0.6%)比较小的模型如ResNet-50的提高(0.2%)要大得多。当训练200个epoch时，ResNet-50混合变量的top-1错误比90个epoch运行时进一步减少1.2%，而它的ERM模拟值保持不变。
对于混合，我们使用了五个阶段的热身期，在这个阶段我们对原始的训练例子进行训练，因为我们发现这样可以加快初始收敛速度。表4显示，在这个任务上，mixup的性能优于ERM，特别是在使用具有更大容量的模型vga -11时。

原理：实质新增了label为 $\lambda(label_i)+(1-\lambda)label_j$ 的样本，样本比原数据更接近分类最佳分类平面，训练时训练更严格，能学到更多的差异特征。

2.马赛克，cutmix

模型

第一步.开发一个baseline

这里，我们使用一个非常简单的架构创建一个基本的模型，没有任何正则化或dropout层，看看我们是否能超过50%的准确率基线。尽管我们不可能总能达到这个目标，但如果我们在尝试了多种合理的架构后不能超过基线，那么输入数据可能不包含模型进行预测所需的信息。backbone尝试常用的 inception ，ResNet,DenseNet等。

第二步.开发一个足够大可以过拟合的模型

一旦我们的基线模型有足够的能力超过基线分数，我们就可以增加基线模型的能力，直到它在数据集上过拟合为止，然后我们就开始应用正则化。我们可以通过以下方式增加模块容量：

添加跟多的层
使用更好的结构
更完善的流程训练
目前存在以下结构模块，可以改进模型的容量，但几乎没有改变计算复杂度；
Residual Networks
Wide Residual Networks
Inception
EfficientNet
Swish activation
Residual Attention Network
大多数时候，模型容量和精度是正相关的 —— 随着容量的增加，精度也会增加，反之亦然。

第三步.训练过程的优化

以下方法用来调整模型的训练过程，通过实例项目来看看他们是如何工作的；

Mixed-Precision Training
Large Batch-Size Training 大尺度训练
Cross-Validation Set 交叉验证
Weight Initialization 权重初始化
Self-Supervised Training (Knowledge Distillation) 自监督训练，知识蒸馏
Learning Rate Scheduler学习率
Learning Rate Warmup 学习率预热先使用小的学习率训练一段，再使用较大的初始学习率
Early Stopping早停，防止过拟合，设置停止条件
Differential Learning Rates 差异化学习率
Ensemble 集成学习
Transfer Learning 迁移学习
Fine-Tuning 微调

超参数调参
与参数不同，hyperparameters是由你在配置模型时指定的(即学习率、epoch的数量、hidden units的数量、batch size大小等)。
你可以通过使用hyperparameter调优库，比如Scikit learn Grid Search，Keras Tuner来自动化这个过程，而不是去手动配置。这些库会在你指定的范围内尝试所有的hyperparameter组合，返回表现最好的模型。
需要调优的超参数越多，过程就越慢，因此最好选择模型超参数的最小子集进行调优。
并不是所有的模型超参数都同样重要。一些超参数会对机器学习算法的行为产生巨大的影响，进而影响其性能。你应该小心地选择那些对模型性能影响最大的参数，并对它们进行调优以获得最佳性能。

损失函数

1.标签平滑(label smooth)

2.Center Loss

惩罚特征向量和类别中心在欧式空间中的距离来增强类内的紧密性，使用级联的 Softmax loss 来保证类间的分离性。但是，在训练时随着 ID 数量的增加，更新类别中心十分困难。与softmax一起使用。
对样本的特征进行相似性进行计算：
使用过程：
1，计算整体训练集中每个类的类内中心
2，训练过程中，返回每个batch的样本的特征向量和结果
3，在每个batch中，计算每个样本到该样本类别的类内中心的欧式距离作为损失函数，这样就提高了类内的聚集。<

最低0.47元/天解锁文章

龙海L

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
图像分类性能提升方案

文章目录1.模型训练调参1.1学习率衰减策略采用cosine函数1.2使用标签平滑(label smooth)1.3知识蒸馏(knowledge distillation)1.4Mixup2.迁移学习在已经成熟的模型参数初始化，训练自己的数据参考文章：https://zhuanlan.zhihu.com/p/114869268在不改变网络模型的前提下的性能提升tricks1.模型训练调参1.1学习率衰减策略采用cosine函数1.2使用标签平滑(label smooth)1.3知识蒸馏(know
复制链接

扫一扫