Adversarially Occluded Samples for Person Re-identification阅读笔记

最新推荐文章于 2024-07-23 14:40:19 发布

MindAndHand

最新推荐文章于 2024-07-23 14:40:19 发布

阅读量1.6k

点赞数

文章标签：遮挡滑动窗口行人重识别阅读笔记

本文链接：https://blog.csdn.net/qq_35226955/article/details/100156298

版权

Adversarially Occluded Samples for Person Re-identification

Houjing Huang，Dangwei Li ，Zhang Zhang，Xiaotang Chen，Kaiqi Huang 2018 CVPR

1.Motivation

通过引入Adversarially Occluded Samples来扩增训练数据的变化。这些样本不仅是有意义的，类似真实场景的遮挡，而且还是有效的，能帮助模型跳出局部最优。

2. 介绍

在这里插入图片描述

3. 方法

简言之就是先用图像训练一个IDE模型，然后将图像遮挡一个patch送给网络识别，如果识别概率骤降，就说明这一块是对于分类至关重要的部分，于是就将这个区域遮挡，对训练好的IDE模型进行微调，直到在遮挡这个patch时还能很好的识别该图像。而这个patch以滑动窗口的形式在图像上重叠滑动，而且可能不止一个区域对于识别图像至关重要，可能有好几个区域都重要。模型框架为：
在这里插入图片描述
整个过程很好理解，损失用的就是常规IDE模型损失。第二阶段的滑动窗口( $d * d$ 像素的窗口)就是每经过一个像素就用 $d * d$ 的窗口遮挡这一区域，然后窗口以 $s_w,s_h$ 的stride滑动。

上图ab除了原图外，其余5个图是分别独立训练了五个模型后，分别找到的对分类影响最大的区域，这些区域都是相同的，说明了模型的设计是合理的。而c-g的第一行是原图，第二行是对分类影响最大的区域，而第三行是用本文的方法后得到的结果，已不再受到这些区域的影响。
一般，可以选择最影响分类的那个patch进行遮挡，然后在第三阶段训练，即Hard-1，但这在影响分类的区域很大(图3f)或不止一个影响分类的区域(图3g)时是次优的，于是作者提出原识别概率为p，遮挡区域i后识别概率为 $p_i$ ，然后利用下式得：
在这里插入图片描述
再norm为下面的分布：

其中 $N_pos$ 是滑动窗口的数量。称为Sampling。