详解ReID的各部分组成及Trick——预处理（Pre-processing）

最新推荐文章于 2024-07-16 13:34:36 发布

藏晖

最新推荐文章于 2024-07-16 13:34:36 发布

阅读量3k

点赞数 3

分类专栏： ReID 深度学习文章标签： pytorch 深度学习

本文链接：https://blog.csdn.net/qq_34919792/article/details/108509858

版权

深度学习同时被 2 个专栏收录

36 篇文章 20 订阅

订阅专栏

ReID

12 篇文章 24 订阅

订阅专栏

数据的预处理也是深度学习中常见的增强策略之一，通过对训练数据做出适合任务域的处理，可以缓解训练集和测试集之间分别不同带来的模型过度拟合训练集而在测试集上的效果下降，提高模型的泛化能力。

1、Resize

       图片的输入尺寸影响模型每个特征图的尺寸，往往，越大的图片输入可以让模型学习到更加清晰高维度的特征，但是会对GPU的显存有更高的要求。对于图片的尺寸和高宽比在BoT的工作中做出了以下的探究。
在这里插入图片描述
       可以看出，高宽比基本上是2：1较好，这样可能能保留更多行人的自然外观信息。在Market1501上看，并不是尺寸越大可以带来更高的收益，而在DukeMTMC中尺寸越大收益越高，可见数据集对尺寸的选取有一定影响。
       在BoT中选取了256x128的图像作为输入，而在FastReID中选取了384x128的图像作为输入。

2、Flipping

翻转（Flipping）作为一种数据增强方法，通过镜像源图像来使数据更加多样化。

3、Random erasing

随机擦除（Random erasing）指的是在不同的epoch中在原始图像中去除一个预先定义大小范围的矩形块，这个大小范围为原图的高宽的1/6~1/2之间，随机擦除效果可以见下图。
在这里插入图片描述
在BoT中，随机擦除在两个数据集上均带来了一定提升。

但是同样值得注意的是BoT中作者也做了一个关于跨域的实验（用DukeMTMC训练的模型去Market1501上测试，用Market1501训练的模型去DukeMTMC上测试），发现随机擦除策略会带来效果下降。作者认为这是因为随机擦除训练图像的区域可以让模型在训练领域学习更多的知识。
在这里插入图片描述

4、Auto-augment

Auto-augment来自于《AutoAugment: Learning Augmentation Strategies from Data》一文，提出了通过数据来学习到一种最佳的扩充策略。文中把寻找最优增强策略定为离散搜索问题（图1），其方法包括两个部分：一个搜索算法和一个搜索空间。简单来说，搜索算法（使用控制器RNN来实现）采样一个数据增强策略，这个策略包括了处理的运算，使用的概率，使用量等信息。方法的关键是策略用于训练固定结构的网络，验证准确率和返回更新控制器。由于准确率不可微分，控制器可以通过策略梯度方法更新。其中包含平移、旋转和剪切等多种图像处理功能。
在这里插入图片描述
更多细节可以参考该链接：https://zhuanlan.zhihu.com/p/67942549