行人重识别之监督学习与无监督学习结合(CVPR2019)
Invariance Matters: Exemplar Memory for Domain Adaptive Person Re-identification
原文链接:https://arxiv.org/abs/1904.01990
这篇文章有两个贡献:
- 将监督学习和无监督学习结合
- 引入了存储器的概念,比较新颖
上图是网络结构,有两个分支。蓝色分支是有标签的source数据库,对应监督学习,利用softmax计算分类损失。橙色分支对应无标签的target数据库,对应无监督学习(有三个损失函数,稍后介绍)。将两个分支的损失加权相加,使两个分支可以同步对网络进行训练。接下来分别介绍三个损失和存储器的思想。
三个损失
- 不同的远离
- 利用GAN生成一张图片的几个风格迁移图片(对应摄像机风格),使其靠近。从而降低不同摄像头的影响
- 相似的靠近
感觉这三个损失函数没什么特别的,但是文章却把这个作为了重中之重来介绍。(希望是我没理解透彻,欢迎大佬指教)
存储器
与上图对应,第i个无标签图片经过网络,获得特征向量v,存储在key中,直接把它的类别存储为i(存在value中)。每输入一个图片,不仅要存在其中,还要与存储器中所有的图片计算损失。如果之前已经存过该图片,那么就利用下式对存储器中它的特征向量进行更新。其中k是存储器中的特征向量,f是网络计算出来的特征向量。a根据epoch数线性增加。
总结:存储器的概念为无监督学习提供了不错的思路,值得借鉴。
完
欢迎讨论 欢迎吐槽