【论文阅读】行人重识别(Person Re-identifition)——Batch Feature Erasing for Person Re-identification and Beyond

《Batch Feature Erasing for Person Re-identification and Beyond》

原文

论文链接: https://arxiv.org/abs/1811.07130

代码链接: https://github.com/daizuozhuo/batch-feature-erasing-network

1. 解决的问题

行人重识别目前所用的方法,如PCB、MGN等,为了使网络学到更精细有区分度的特征,多数是将最后得到的Feature map 进行水平切分后分别求Loss,但是简单做水平切分可能会造成一块完整的Feature失去信息,比如背包等。所以多数研究者都做了相应的改进,所以PCB之后加上了RPP把没有切分好的feature重新划分,需要进行两阶段的训练。而MGN的则是用了一个比较复杂包含多种切分的方法的网路,切两次,切三次,最后把这些feature融合起来。

切分feature map的本质是什么? 本质上就是为了不让网络太关注于那些太显而易见的全局特征。因为行人重识别是一个zero shot learning的问题,就是说训练中的人和测试中的人是不同的人,而且主流的行人数据集都较小,容易过拟合, 导致这些在训练的时候表现很好的全局特征在测试的时候反而达不到最好的效果。那么除了这样水平切分特征

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
transformer在自然语言处理任务中取得了显著的成果,但在视觉任务中的应用较少。最近,有一些基于transformer的行人重识别(reid)方法被提出。 传统的行人重识别方法通常是在卷积神经网络(CNN)的特征提取器和分类器之间使用降维算法(如PCA或LDA)来构建特征向量,并将它们输入到分类器中。这种方法的局限是在处理变长序列的输入时存在困难:因为对于不同行人,可能需要提取不同数量的图像帧。 基于transformer的reid方法通过建立一个序列到序列的模型来处理变长序列的输入。这些方法通常采用自注意力机制(self-attention mechanism),这意味着模型可以自动地学习输入序列中每个元素之间的关系,并将其编码为一个固定长度的向量。这个向量可以在之后的分类器中使用。 其中一种基于transformer的reid方法是MGN (Multi-Granularity Network),它使用了多个并行的transformer模块,以提取多个不同尺度的特征。这些特征随后被连接并输入到分类器中。 另一个基于transformer的reid方法是DG-Net (Disentangled Graph Convolutional Network),它使用transformer作为局部区域的特征提取器,并利用图卷积网络对这些特征进行汇聚和整合。 总体而言,基于transformer的reid方法为处理变长序列的输入提供了一个新的解决方案,并可望在行人重识别等视觉任务中取得更好的表现。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值