CVPR2019-行人重识别-Interaction-and-Aggregation Network for Person Re-identification

动机:

本文是一篇基于attention的文章,通过channel 和 postion 两个层面得到feature mask,用于得到更有鉴别性的feature。

创新

  1. Spatial Interaction-and-Aggregation (SIA):这里涉及到三个种相关性关系:Appearance RelationsLocation Relationssemantic relations.作者分析着重讲解了Appearance Relations。相同卷积层的对应相同的感受野,但是样本大小不同,不同样本对应同一part的大小不同,同一样本随姿态变化,同一part也会变化,所以对于同一feature map要采用不同尺寸的patch以满足同一位置不同尺寸的part。
    在这里插入图片描述
  • 对于Appearance Relations,同一个featuremap,对每一个位置提取K×K尺寸的patch对应相乘,从而得到一个等大小feature后,之后再采用不同的K,比如1,2,3……N,得到N个feature mask,之后再将其点乘,得到最后的feature mask
    在这里插入图片描述
  • 对于Location Relations,这个从公式就很好理解,如果两个点的对应特征向量越相似,那么两个点之间,求二维高斯函数的响应就会越大。
    在这里插入图片描述
  • 对于semantic Relations,就是将Appearance RelationsLocation Relations融合。
    在这里插入图片描述
  1. Channel Interaction-and-Aggregation (CIA) module.这个很好理解,就是普通的Channel attention,因为不同层对应的语义信息不同,所以通过得到channel的相关矩阵,从而得到channel的feature mask
    在这里插入图片描述
  • 方法就是通过reshape操作,将原C×H×W的矩阵转换成C×(H×W)和(H×W)×C两个矩阵,这两个矩阵相乘后得到C×C,之后再与C×(H×W)相乘,reshap,得到C×H×W大小的feature mask

框架:

在这里插入图片描述
框架结构:单流结构
特征:通过SIA和CIA得到的特征
损失函数:CE loss
backbone:resnet50,在不同层之间添加attention module

实验:

对比了feature的融合方法,影响不大
在这里插入图片描述
对比了不同的相关矩阵应用到feature mask,结果是semantic Relations效果最好。
在这里插入图片描述
对比了不同patch大小对的影响,太大和太小结果都不好,所以采用一个适中的size
在这里插入图片描述
在主流数据集上的结果
在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值