- 基本思路:利用source domain和target domain进行混合训练,以domain adaption
a) Target domain利用camStyle进行各个摄像头的数据增强
b) Source和target经过ResNet50的baseline
c) 输出有两个branches:
-
-
- 一个是cross-entropy loss for classification
- 一个是triplet loss for similarity learning:source的anchor image,利用source label构建正样本对,然后再选择target image形成负样本对。
-
- 文章的Hetero-Homogeneous Learning
- 在训练阶段,每个batch包含了labeled source images,unlabeled real target images以及对应的camStyle生成的fake target images。这样,前二者是学习两个domain之间的关系,后两者学习到了target domain中的camera invariances。
- Discussion作者的讨论很有意思
- Change of image style caused by different cameras on target set is a key infuencing factor that should be explicitly considered in person re-ID UDA.
- 为了使每个mini-batch里面样本的id都不相同,作者比较了三种采样:一是随机采样;而是先对数据做k均值分类,然后每类选一张;第三是用target的标签进行监督式的。最后发现随机采样和监督的效果近似。