[CVPR2019]Interaction-and-Aggregation Network for Person Re-identification论文笔记

1. 摘要

该论文方向为有监督行人重识别。
当前ReID任务有一些比较大的挑战,最主要的为行人姿态和范围变化大和背景杂波。这会导致不同行人图像中的身体没办法对齐。当前其他论文的解决方法有定位身体部分并提取特征(基于姿态,基于注意力机制等)和进行多层次多尺度的特征融合。但这两种方法不够有效,因为1)CNN网络的结构皆为矩形不符合人体结构。2)单层CNN的所有激活单元的感受野相同会导致小尺度物体特征的丢失。
该论文提出一个IA Network(Interaction-and-Aggregation Network),能够提高特征的表达能力。IA Network包括SIA(Spatial IA)和CIA(Channel IA)两个部分。SIA部分对空间特征相关性进行建模,而CIA部分对于通道特征相关性进行建模。SIA和CIA组成的IA block能够在任意网络的任意位置插入。

2. 方法

2.1 SIA

输入的特征图为 F ∈ R C × H × W F ∈ R^C×H×W FRC×H×W,将其reshape至 F ∈ R C × M ( M = H × W ) F ∈ R^C×M(M=H×W) FRC×MM=H×W
在这里插入图片描述
SIA解决行人姿态和人体图像范围变化大的问题,通过获得空间特征的相关性。
Appearance Relation Map
定义相关空间位置的特征具有高度相关性,故包含相关位置的Patch也具有高度相关性。将Patch进行点乘得到乘积作为 f i f_i fi f j f_j fj的相关性。
在这里插入图片描述
在这里插入图片描述
其中K表示Patch的大小,A代表Appearance,求出所有 f i f_i fi f j f_j fj的相关性后用softmax归一化,最终得到 S k A S_k^A SkA相关性矩阵。
在这里插入图片描述
将k不同取值的 S k A S_k^A SkA进行softmax就可得到最中的 S A S^A SALocation Relation Map
定义相邻位置的特征应具有相关性。
在这里插入图片描述
其中 ( x i , y i ) (x_i,y_i) (xi,yi) ( x j , y j ) (x_j,y_j) (xj,yj)代表 f i f_i fi f j f_j fj的坐标。
在这里插入图片描述
在这里插入图片描述
semantic relations
将外貌相关性和位置相关性融合。
在这里插入图片描述
Aggregation Operation
将得到的最终语义相关图和特征图相点乘得到最终的特征图。
在这里插入图片描述

2.2 CIA

在这里插入图片描述
首先将F重塑为 R C × M ( M = H × W ) R^C×M(M=H×W) RC×MM=H×W,然后对F与F的转置进行矩阵乘法,并对结果进行规范化处理,得到信道语义关系映射C∈RC×C,其中任意两条通道之间的语义相似度计算如下:
在这里插入图片描述
将得到的最终通道相关图和特征图相点乘得到最终的特征图。
在这里插入图片描述

2.3 IA block

在这里插入图片描述

在这里插入图片描述

3. 实验结果

在这里插入图片描述

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值