[CVPR2019]Interaction-and-Aggregation Network for Person Re-identification论文笔记

最新推荐文章于 2023-03-19 23:27:57 发布

爱吃蛋炒饭的小老鼠

最新推荐文章于 2023-03-19 23:27:57 发布

阅读量265

点赞数 1

分类专栏： CVPR读书笔记文章标签：计算机视觉人工智能

本文链接：https://blog.csdn.net/qq_29380039/article/details/109243252

版权

CVPR读书笔记专栏收录该内容

3 篇文章 0 订阅

订阅专栏

文章目录

1. 摘要
2. 方法
3. 实验结果

1. 摘要

该论文方向为有监督行人重识别。
当前ReID任务有一些比较大的挑战，最主要的为行人姿态和范围变化大和背景杂波。这会导致不同行人图像中的身体没办法对齐。当前其他论文的解决方法有定位身体部分并提取特征（基于姿态，基于注意力机制等）和进行多层次多尺度的特征融合。但这两种方法不够有效，因为1）CNN网络的结构皆为矩形不符合人体结构。2）单层CNN的所有激活单元的感受野相同会导致小尺度物体特征的丢失。
该论文提出一个IA Network（Interaction-and-Aggregation Network），能够提高特征的表达能力。IA Network包括SIA（Spatial IA）和CIA（Channel IA）两个部分。SIA部分对空间特征相关性进行建模，而CIA部分对于通道特征相关性进行建模。SIA和CIA组成的IA block能够在任意网络的任意位置插入。

2. 方法

2.1 SIA

输入的特征图为 $F ∈ R^C×H×W$ ，将其reshape至 $F ∈ R^C×M（M=H×W）$ 。
在这里插入图片描述
SIA解决行人姿态和人体图像范围变化大的问题，通过获得空间特征的相关性。
Appearance Relation Map
定义相关空间位置的特征具有高度相关性，故包含相关位置的Patch也具有高度相关性。将Patch进行点乘得到乘积作为 $f_i$ 和 $f_j$ 的相关性。
在这里插入图片描述

其中K表示Patch的大小，A代表Appearance，求出所有 $f_i$ 和 $f_j$ 的相关性后用softmax归一化，最终得到 $S_k^A$ 相关性矩阵。

将k不同取值的 $S_k^A$ 进行softmax就可得到最中的 $S^A$ 。Location Relation Map
定义相邻位置的特征应具有相关性。
在这里插入图片描述
其中 $x_i,y_i)$ 和 $x_j,y_j)$ 代表 $f_i$ 和 $f_j$ 的坐标。

semantic relations
将外貌相关性和位置相关性融合。

Aggregation Operation
将得到的最终语义相关图和特征图相点乘得到最终的特征图。

2.2 CIA

在这里插入图片描述
首先将F重塑为 $R^C×M（M=H×W）$ ，然后对F与F的转置进行矩阵乘法，并对结果进行规范化处理，得到信道语义关系映射C∈RC×C，其中任意两条通道之间的语义相似度计算如下：

将得到的最终通道相关图和特征图相点乘得到最终的特征图。
在这里插入图片描述

2.3 IA block

在这里插入图片描述

3. 实验结果

在这里插入图片描述

爱吃蛋炒饭的小老鼠

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
[CVPR2019]Interaction-and-Aggregation Network for Person Re-identification论文笔记

文章目录1. 摘要2. 方法2.1 SIA2.2 CIA2.3 IA block3. 实验结果1. 摘要该论文方向为有监督行人重识别。当前ReID任务有一些比较大的挑战，最主要的为行人姿态和范围变化大和背景杂波。这会导致不同行人图像中的身体没办法对齐。当前其他论文的解决方法有定位身体部分并提取特征（基于姿态，基于注意力机制等）和进行多层次多尺度的特征融合。但这两种方法不够有效，因为1）CNN网络的结构皆为矩形不符合人体结构。2）单层CNN的所有激活单元的感受野相同会导致小尺度物体特征的丢失。该论文提
复制链接

扫一扫