Weakly Supervised Person Re-Identification
Jingke Meng,, Sheng Wu, and Wei-Shi Zheng 2019 CVPR
1. Motivation
还是处理ReID标注太难问题,做无监督和弱监督才比较实际。现在作者想打一个什么样的标签呢?原本是将视频帧中的行人裁出来打上ID标签,但costly。作者现在对视频帧不处理,直接打上有哪些人的标签,而不具体对应到那个框是哪个ID,于是就将弱监督问题转换为multi-instance multi-label learning(MIML)问题,最后还提出Cross-View MIML。
2. 介绍
标签形式:
共C人,标注C+1类标签,其中1是不确定ID的标签。
3. 方法
3.1 分类
首先是probe图像的分类损失:
和gallery图像的分类损失:
分类损失合写为:
3.2 Intra-bag Alignment
即同一摄像头下拍的视频中same ID图像聚类到一起,如下所示:
损失为:
3.3 Cross-view Bag Alignment
既让不同视野(相机)下相同行人的图像聚类到一起,如下图所示:
损失为:
最终,总损失为:
其中:
是熵正则化项。
实验结果:
和有监督的PCB差不多的性能。