Unlabeled Samples Generated by GAN Improve the Person Re-identification Baseline in vitro
创新点
本文的主要贡献是一个简单的半监督管道,它只使用原始训练集而不收集额外的数据。它的挑战在于: 1)如何只从训练集中获取更多的训练数据;2)如何使用新生成的数据。在本工作中,生成对抗性网络(GAN)用于生成未标记的样本。同时提出离群值的标签平滑正则化(LSRO)。 此方法为未标记的图像分配均匀的标签分布,从而规范了受监督的模型并改善了基线。
具体
论文中提出的pipeline如上,由基础数据集Market-1501借助GAN来生成数据集。对于生成数据,作者采用了一种不同的正则化(label smoothing regularization for outliers (LSRO))方法,将均匀的标签分布分配给生成的样本,如下是真实图片和生成图片的标签分布。
LSR
平常用于计算分类的cross-entropy loss:
l = − ∑ k = 1 K l o g ( p ( k ) ) q ( k ) (1) l = -\sum^K_{k=1}log(p(k))q(k)\tag{1} l=−k=1∑Klog(p(k))q(k)(1)
其中,K是数据集中总类别数,k是当前数据所属类别,