Bi-directional Interaction Network for Person Search 阅读笔记

Bi-directional Interaction Network for Person Search 阅读笔记

CVPR 2020
Wenkai Dong1, 3, Zhaoxiang Zhang1, 2, 3∗, Chunfeng Song1, 3, Tieniu Tan1, 2, 3∗

problem

Due to the large receptive fields in deep networks,文章提到由于网络有着广阔的感受野,导致propsal在crop的时候包含了许多除边界框以外的上下文信息,这些信息会使search网络无法聚焦于人,导致缺乏辨别不同身份的能力。(search需要精确的人的外观信息,在训练时会很容易受到其他信息干扰,导致在推理中模型无法聚焦于人)

motivation

1.要减轻冗余的上下文信息带来的影响,
2.模型需要额外的行人图片来训练,从冗余的上下文信息中区分出人的外观特征
3.在推理阶段要做到高效(这里是和19年Query-guided end-to-end person search做了一个对比,Q这篇文章是将query信息引入网络,同样利用了上下文信息,但是要为每个query和proposal计算,计算量过大,同时不符合实际)

Contribution

在这里插入图片描述

文章提出了一个带有instance-aware branch分支的Siamese network。如上图所示,引出一个分支,输入的是从原始图像中的行人图片,这样可以帮助模型专注于识别行人。另外提出两个loss来实现两分支的交互(反向过程中)。在推理阶段,就去掉分支,减少计算量。

method

网络框架图:
在这里插入图片描述
文章从feature-level 和prediction-level 层面保持一致性,对于ROI,前者意味着特征空间中的紧密结合,后者意味着两个分支输出相同的身份预测。

Feature-level interaction
在这里插入图片描述

Prediction-level interaction
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值