AAAI2020|Domain Adaptative Attention Learning for Unsupervised Cross-Domain Person Re-Identification

最新推荐文章于 2023-10-31 19:24:08 发布

桑戈塔的七菇凉

最新推荐文章于 2023-10-31 19:24:08 发布

阅读量1.5k

点赞数 1

分类专栏：论文笔记文章标签：聚类机器学习计算机视觉

本文链接：https://blog.csdn.net/weixin_40607428/article/details/104790594

版权

论文笔记专栏收录该内容

11 篇文章 0 订阅

订阅专栏

文章目录

1 Abstract & Introduction

A novel domain adaptive attention model:(两个部分）
Domain-shared feature map(DSH)具有迁移性，用于辅助目标域上的重识别
Domain-specific feature map(DSP)用于消除由于域间差异引起的负迁移
A novel problem formulation of the domain adaptation task as one-class classification task is proposed with a domain similarity loss.
利用域间相似度损失，将域自适应问题看成一个单分类任务。
A novel unsupervised person Re-ID loss is proposed to the unlabeled target domain based on a clustering process and the weighted cross-entropy loss.
基于聚类过程和加权交叉熵损失，在无标签目标域上提出一种新的无监督行人重识别损失。

2 Related Works

3 Methodology

整个网络包括四个部分：a backbone network，a domain adaptive attention module，a domain-shared branch和a domain-specific branch。
backbone network选用ResNet-50。
在这里插入图片描述

3.1 Domain Adaptive Attention Module

任意图像x的特征映射Fx都可以被分成domain-shared discriminative feature map $F^{sh}_x$ 和domain-specific feature map $F^{sp}_x$ ，因此我们要学习一个domain-shared attention map $A(F_x)\isin{(0,1)^{h*w*c}}$ :
在这里插入图片描述
根据文献¹, $A(F_x)$ 可以分解成空间注意力 $S(F_x)\isin{(0,1)^{h*w*1}}$ 和通道注意力 $C(F_x)\isin{(0,1)^{1*c}}$ :

Spatial Attention Module
空间注意力模块的输入是特征映射 $F_x$ ，输出是空间注意力 $S(F_x)$ ，通过挖掘特征中所有通道共有的像之间的关系来得到。因此先对所有通道进行全局平均池化过程，再经过一个卷积层（ $3\times3$ ,stride $2$ )和上采样层，最后为了有效和通道信息结合，添加了一个卷积层( $1\times1$ )来自动学习一个adaptive scale。
Channel Attention Module
通道注意力模块的输入是特征映射 $F_x$ ，输出是空间注意力 $C(F_x)$ ，通过挖掘特征中通道之间的关系来获得。
在这里插入图片描述

3.2 Domain-Shared Branch

给定任意图像的 $F^{sh}_x$ ，DSH的作用就是提取一个能用于目标域上行人重识别的特征。通过Global Average Pooling，Batch Normalized和ReLU active之后，将 $F^{sh}_x$ 投影成一个256维的特征向量 $f^{sh}_x$ 。为了使 $f^{sh}_x$ 既具有在不同域上的可迁移性，又对不同行人具有判别性，引入两种损失：domain similarity loss和person re-ID loss。
Domain Similarity Loss
一个自然的思路是使得 $f^{sh}_x$ 的分布在源域和目标域上相似。将源域和目标域中的图像投影到一个统一的新的nominal domain中，可以看成一个one-class classification(OCC)问题。
一个 $256\times1$ 的全连接层和激活层，用来预测图像 $x$ 属于新domain的概率 $p^o(x)$ ，domain similarity loss：
在这里插入图片描述

OCC vs. GRL: GRL试图模糊域之间的差异，而OCC试图拉近两种域的分布。
OCC vs. MDD: MDD要求源域和值域具有相同的类别标签，但re-id中源域和目标域上具有完全不同的行人标签。
Person Re-ID Loss
对于带标签的源域来说，和有监督学习一样采用交叉熵损失：

对于无标签的目标域来说，用在源域上训练好的模型对其提取特征后，用k平均聚类的方法为其打上弱标签：

采用加权交叉熵损失：

由于标签是估计的，不准确，越靠近聚类中心的样本标签具有更大的置信度，权重可由下式决定：

3.3 Domain-Specific Branch

该分支的主要目的是为了保证最后输出的特征 $f^{sp}_x$ 对不同的域具有判别性，因此引入一个 $256\times2$ 的FC层和softmax function，用于预测任意图像 $x$ 属于源域或是目标域的概率 $p^s(x)$ 和 $p^t(x)$ 。
在这里插入图片描述
最后，为了保证 $f^{sh}_x$ 和 $f^{sp}_x$ 完全互斥且独立，使其具有软正交限制：

4 Learning

整个网络的总损失：
在这里插入图片描述
算法流程：

5 Experiments

和现有无监督域适应方法比较
在这里插入图片描述

Ablation Studies

(1) Effectives of network modules
验证网络各个模块的有效性
在这里插入图片描述
(2) Effectiveness of the proposed losses

验证用于拉近域间分布的损失 $L^{DS}$ 的有效性
与两种情况比较：一种是直接去掉 $L^{DS}$ ，一种是换成GRL方法。
验证目标域上加权交叉熵损失的有效性
将权重都设成1时，准确率大大降低。

(3) Influences of hyper-parameters
迭代次数
均在五次以后达到收敛
聚类类别数K
在两个数据集上测试K=650时效果最好
Visualisation
domain-shared feature map更注重行人身体部位，而domain-specific feature map更注重背景和其他因素。

W. Li, X. Zhu, and S. Gong. Harmonious attention network for person re-identification. In CVPR, pages 2285–2294, 2018. 3 ↩︎

桑戈塔的七菇凉

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
5
评论
AAAI2020|Domain Adaptative Attention Learning for Unsupervised Cross-Domain Person Re-Identification

@TDomain Adaptive Attention Learning forUnsupervised Cross-Domain Person Re-IdentificationOC欢迎使用Markdown编辑器你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章，了解一下Markdown的基本语法知识。新的...
复制链接

扫一扫