Learning View-Speciﬁc Deep Networks for Person Re-Identiﬁcation

最新推荐文章于 2024-07-16 13:34:36 发布

展希希鸿

最新推荐文章于 2024-07-16 13:34:36 发布

阅读量392

点赞数

分类专栏：行人重识别

本文链接：https://blog.csdn.net/qq_28266311/article/details/86511491

版权

行人重识别专栏收录该内容

12 篇文章 0 订阅

订阅专栏

摘要

行人重识别最主要的挑战就是由于视角变化而引起的类内变化。为了克服这一问题，本文进行了以下实现：

1. 提出了一种基于深度神经网络的框架，该框架利用特征提取阶段中的视图信息。

2. 所提出的框架为每个摄像机视图学习视图特定网络，其具有交叉视图欧几里德约束（CV-EC）和交叉视图中心损失。我们利用CV-EC来减少不同视图之间的特征边缘，并将中心损失度量扩展到视图特定版本，以更好地适应重新定义问题。

3. 我们提出了迭代优化算法（ICV-ECCL）来交替学习CV-EC和CV-CL并优化视图特定网络的参数从粗到细。

传统的实现方式是首先使用同一网络来提取不同视觉下的共有特征，然后再使用度量学习或者视角不变的判定不变换来缩小类内差距，同时增大类间差距来实现行人重识别。

首先，只是用共同视觉特征在解决跨视角问题上有一定的不足，因此，还需要使用的特定视觉特征。

其次，特征提取和视觉不变模型是相互独立的，识别模型与特征提取模型很少联合起来一起提高特征提取过程。度量学习对于跨视角图像学习同一行人特征是非常困难的。

第三，传统的方法学习视觉不变模型用于所有的视角。特定视觉模型覆盖很多视觉相关信息（每个视角下都使用各自独立的网络），因此可以实现更好的效果。

因此，本文将基于学习特定视角的深度网络来实现行人重识别。

本文的主要贡献：

1. 提出了一种基于深度神经网络的框架，该框架利用特征提取阶段中的视图信息。

2. 所提出的框架为每个摄像机视图学习视图特定网络，其具有交叉视图欧几里德约束（CV-EC）和交叉视图中心损失。我们利用CV-EC来减少不同视图之间的特征边缘，并将中心损失度量扩展到特定视图版本，以更好地适应行人重识别问题。

3. 我们提出了迭代优化算法（ICV-ECCL）来交替学习CV-EC和CV-CL并优化视图特定网络的参数从粗到细。

由于通过特定视角深度网络在提取与视觉相关的特征时，可能存在跨域视觉的类内特征的距离很大，为了克服这种问题，需要考虑到跨域视觉约束。我们需要最小化特定视角特征对的类内跨域视觉距离。因此，本文加入了CV-EC来解决这一问题。

为了便于讨论，这里只考虑两个摄像头的情况，实际该模型可以扩展到多个摄像头场景中使用。

CV-EC

CV-EC的目的是为了最小化不同的特定视角网络下两个特征对跨视觉的类内距离。作者选择在最后的全连接层之间实现CV-EC度量，这样在提取low-level特征的同时提取 view-speciﬁc information 。本文通过联合softmax 损失和最小化的CV-EC来提取有区别的特征。具体公式为;