Visible-Infrared Person Re-Identification via Homogeneous Augmented Tri-Modal Learning
简述:
现有的方法通常只学习了跨模态特征,而忽略了图像层次的差异。生成图像的思路目前有些方法采用GAN生成交叉模态图像,但会破坏局部结构并引入噪声。本文通过生成的RGB图像的灰度图作为辅助,以减少RGB与IR图像的large gap。
模型:
本文框架方面通过3个3通道(RGB,Gray,IR)的分别输入到共享权重的Res50学习共有特征,重点在loss上:
1.HHI loss:同质和异质分类损失
首先是个ID loss:
对RGB和灰度做smooth L1 loss: