详解ReID的各部分组成及Trick——预处理(Pre-processing)

       数据的预处理也是深度学习中常见的增强策略之一,通过对训练数据做出适合任务域的处理,可以缓解训练集和测试集之间分别不同带来的模型过度拟合训练集而在测试集上的效果下降,提高模型的泛化能力。

1、Resize

       图片的输入尺寸影响模型每个特征图的尺寸,往往,越大的图片输入可以让模型学习到更加清晰高维度的特征,但是会对GPU的显存有更高的要求。对于图片的尺寸和高宽比在BoT的工作中做出了以下的探究。
在这里插入图片描述
       可以看出,高宽比基本上是2:1较好,这样可能能保留更多行人的自然外观信息。在Market1501上看,并不是尺寸越大可以带来更高的收益,而在DukeMTMC中尺寸越大收益越高,可见数据集对尺寸的选取有一定影响。
       在BoT中选取了256x128的图像作为输入,而在FastReID中选取了384x128的图像作为输入。


2、Flipping

       翻转(Flipping)作为一种数据增强方法,通过镜像源图像来使数据更加多样化。


3、Random erasing

       随机擦除(Random erasing)指的是在不同的epoch中在原始图像中去除一个预先定义大小范围的矩形块,这个大小范围为原图的高宽的1/6~1/2之间,随机擦除效果可以见下图。
在这里插入图片描述
在BoT中,随机擦除在两个数据集上均带来了一定提升。
在这里插入图片描述
       但是同样值得注意的是BoT中作者也做了一个关于跨域的实验(用DukeMTMC训练的模型去Market1501上测试,用Market1501训练的模型去DukeMTMC上测试),发现随机擦除策略会带来效果下降。 作者认为这是因为随机擦除训练图像的区域可以让模型在训练领域学习更多的知识。
在这里插入图片描述


4、Auto-augment

       Auto-augment来自于《AutoAugment: Learning Augmentation Strategies from Data》一文,提出了通过数据来学习到一种最佳的扩充策略。文中把寻找最优增强策略定为离散搜索问题(图1),其方法包括两个部分:一个搜索算法和一个搜索空间。简单来说,搜索算法(使用控制器RNN来实现)采样一个数据增强策略,这个策略包括了处理的运算,使用的概率,使用量等信息。方法的关键是策略用于训练固定结构的网络,验证准确率和返回更新控制器。由于准确率不可微分,控制器可以通过策略梯度方法更新。其中包含平移、旋转和剪切等多种图像处理功能。
在这里插入图片描述
更多细节可以参考该链接:https://zhuanlan.zhihu.com/p/67942549


5、Random patch

       随机补丁(Random patch)和之前的随机擦除的操作有些类似,不同的是是通过从其他的图像来获得相关的补丁。


6、Cutout

       Cutout操作则是把去除的位置设置为0,以上操作的区别可以参考下图。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值