论文阅读之 Joint Detection and Identification Feature Learning for Person Search

star_function

已于 2022-01-29 23:55:57 修改

阅读量1.8k

点赞数

分类专栏：行人重识别文章标签：深度学习 cnn 机器学习

于 2022-01-29 23:54:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39220334/article/details/122747061

版权

行人重识别专栏收录该内容

21 篇文章 23 订阅

订阅专栏

论文链接：CVPR_2017 论文
代码链接：Github链接
提出的数据集：CUHK-SYSY
原始论文题目：End-to-End Deep Learning for Person Search

1. 研究的主要问题

行人检索问题：在真实场景中，从整个场景图片中搜索特定的没有行人检测边界框的人。在一个卷积神经网络中实现同时处理行人检测和行人重识别，而不是分成行人检测和行人重识别两个子任务进行行人检索。

下图给出了行人重识别和行人搜索任务的区别：
在这里插入图片描述

2. 主要工作

提出联合行人检测和行人重识别的行人搜索框架

ResNet-50 作为基础 CNN 模型，在模型生成的特征图上构建一个行人 proposal 网络来检测行人。
为了从行人建议网络生成的候选框中找到目标行人，构建 identification 网络提取每个候选框的特征，并与目标行人做对比。
OIM loss 和其他用于检测的 loss 一起被用于多任务学习的模型训练。
在这里插入图片描述

提出 OIM loss

在这里插入图片描述

提出 Person Search 数据集

数据集来源和划分如下图所示。
在这里插入图片描述
数据集中行人 scale 如下图所示

3. 实验

为了验证提出方法的有效性，和探索行人检索任务的影响因素，进行了一系列的实验。
框架基于 Caffe 版本的 Faster R-CNN 实现，经过 ImageNet 预训练的 Resnet50 用于参数初始化。

实验一：不同检测器的召唤率

下图给出了实验使用的不同检测器的召回率。
在这里插入图片描述

实验二：行人检测和行人重识别分离 vs 提出的联合行人检测和行人重识别

不同的检测器会对行人搜索任务产生影响，现有的行人重识别数据集可以指导设计行人重识别特征，但加入行人检索数据集中未标注的数据和背景可以带来更大的收益。联合行人检测和行人重识别的行人检索框架比分开处理两个任务效果更好。

不同检测器和行人重识别特征标识+距离度量下的实验结果如下表所示：
在这里插入图片描述

实验三：OIM loss 的有效性

OIM loss 收敛得更快，未经过 pretrain 的 softmax loss 训练效果很差。在 test 过程中，经过 pretrain 的 softmax loss 性能也不是很好。

在这里插入图片描述
在标准的行人重识别任务中，OIM loss 依旧比 softmax 表现得好。

在这里插入图片描述

实验四：L2 正则化的特征子空间的维度

将特征映射到低维空间对归一化训练网络很重要，实验表明 256-1024 维效果相同，选择 256 维加速特征距离计算。
在这里插入图片描述

实验五：行人检索的影响因素

较小的 OIM loss 的采样尺寸带来逊色的表现，但较快的收敛率

LOMO+XQDA 行人重识别方法下，高的检测召回率不一定导致更高的行人检索性能。应该在行人检索问题中综合考虑行人检测和行人重识别，而不是仅考虑在手动剪裁好的图片中训练行人重识别模型。

随着 Gallery 尺寸的增大，所有的行人重识别方法性能都有所下降。这是由于难样本引起的，可以考虑难例挖掘来提高模型性能。

在这里插入图片描述

参考链接

[论文笔记]CVPR2017_Joint Detection and Identification Feature Learning for Person Search

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
论文阅读之 Joint Detection and Identification Feature Learning for Person Search

论文链接：CVPR_2017 论文代码链接：Github链接提出的数据集：CUHK-SYSY原始论文题目：End-to-End Deep Learning for Person Search1. 研究的主要问题行人检索问题：在真实场景中，从整个场景图片中搜索特定的没有行人检测边界框的人。在一个卷积神经网络中实现同时处理行人检测和行人重识别，而不是分成行人检测和行人重识别两个子任务进行行人检索。下图给出了行人重识别和行人搜索任务的区别：2. 主要工作提出联合行人检测和行人重识别的行人搜索框
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。