一、提出问题
度量学习是行人重识别任务中的重要组成部分之一,但是度量损失的性能受采样方法的显着影响,传统的采样方法极大地限制了深度度量学习的性能。
二、论文贡献
- 提出了一种新的度量损失,即硬感知点集(HAP2S)损失,该损失涉及自适应困难挖掘机制;
- 在Market-1501,CUHK03和DukeMTMC-reID 三个数据集上进行测试,HAP2S损失达到了SOTA。
三、模型结构
图3-1 模型结构
3.1 概况
深度度量度学习的目的是学习一个将图像x映射到对应的特征表示的深度神经网络,其适合于预定义的度量,在Θ中包含网络的参数权重和偏差。 对于行人重识别,可以通过训练好的深度提取探测器提取probe和gallery图像的特征,然后计算两者特征之间的距离并获得距离排序列表。在其中度量损失的作用是为监督网络训练提供判别度量。
模型结构如图3-1所示,采用预训练的CNN模型作为骨干网络,将每个行人图像转换为特征嵌入,本文选用的骨干网络是ResNet-50模型,它由五个下采样块和一个全局平均池化层组成。骨干网络之后是两个全连接层,分别具有1024和128个神经元。在骨干网和两个FC层之后,利用网络提取的输出特征计算小批量中的HAP2S损失,用欧式距离作为点对点(P2P)的度量。
3.2 回顾Triplet Loss
设一个三元组,
是锚点,