行人重识别

最新推荐文章于 2024-09-08 12:58:08 发布

zhongrui1984

最新推荐文章于 2024-09-08 12:58:08 发布

阅读量1.4k

点赞数

文章标签：计算机视觉深度学习机器学习

原文链接：https://baike.baidu.com/item/%E8%A1%8C%E4%BA%BA%E9%87%8D%E8%AF%86%E5%88%AB/20815009?fr=aladdin

版权

行人重识别（Person re-identification）也称行人再识别，是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。广泛被认为是一个图像检索的子问题。给定一个监控行人图像，检索跨设备下的该行人图像。旨在弥补固定的摄像头的视觉局限，并可与行人检测/行人跟踪技术相结合，可广泛应用于智能视频监控、智能安保等领域。

由于不同摄像设备之间的差异，同时行人兼具刚性和柔性的特性，外观易受穿着、尺度、遮挡、姿态和视角等影响，使得行人重识别成为计算机视觉领域中一个既具有研究价值同时又极具挑战性的热门课题。

定义

行人重识别（Person re-identification）也称行人再识别，是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。广泛被认为是一个图像检索的子问题。 [1] 给定一个监控行人图像，检索跨设备下的该行人图像。旨在弥补固定的摄像头的视觉局限，并可与行人检测/行人跟踪技术相结合 [2] ，可广泛应用于智能视频监控、智能安保等领域。 [3]

发展历史

行人重识别的研究起始于二十世纪九十年代中期。研究者们借鉴、引入了一些图像处理、模式识别领域的成熟方法，侧重研究了行人的可用特征、简单分类算法。自2014 年以来，行人重识别技术的训练库趋于大规模化，广泛采用深度学习框架。随着高校、研究所以及一些厂商的研究持续深入，行人重识别技术得到了飞速的发展。

海外主要的行人重识别系统的研究机构有悉尼科技大学（UTS）、伦敦玛丽女王大学（QMUL）等；中国大陆及港澳台的主要有清华大学、北京大学、复旦大学、香港中文大学、西安交通大学、中国科学技术大学、中山大学，中科院自动化所等。

2020年，依图科技在ReID领域取得新突破，刷新业界三大权威数据集当前最优成绩(SOTA)，算法性能达到业界迄今最高标准，极大拓展了算法和应用的边界 [4] ，加速行人重识别(ReID)大规模商业化落地 [4] 。

技术难点

1. 能不能用人脸识别做重识别？

理论上是可以的。但是有两个原因导致人脸识别较难应用：首先，广泛存在后脑勺和侧脸的情况，做正脸的人脸识别难。其次，摄像头拍摄的像素可能不高，尤其是远景摄像头里面人脸截出来很可能都没有32x32的像素。所以人脸识别在实际的重识别应用中很可能有限。 [5]

2.有些人靠衣服的颜色就可以判断出来了，还需要行人重识别么？

衣服颜色确实是行人重识别做出判断一个重要因素，但光靠颜色是不足的。首先，摄像头之间是有色差，并且会有光照的影响。其次，有撞衫（颜色相似）的人怎么办，要找细节，但比如颜色直方图这种统计的特征就把细节给忽略了。在多个数据集上的测试表明，光用颜色特征是难以达到50%的top1正确率的。 [5]

方法

基于部件匹配的方法

基于人体在三维空间中的结构（结构信息），人体图像可以进行分割，按部件来执行匹配。

1.常见方案是水平切割，就是将图像切为几个水平的条。由于人体身材往往差不多，所以可以用简单的水平条来做一一比较。 [6]

2.在领域中做匹配，采用的是一个正方形的邻域。 [7]

3.另一个较新的方案是先在人体上检测部件（手，腿，躯干等等）再进行匹配，这样的话可以减少位置的误差，但可能引入检测部件的误差。 [8]

4. 类似LSTM的attention匹配，但必须pair输入，测试时间较长，不适合快速图像检索。 [9]

5. 如图，类似人脸对齐，使用STN 将行人整个图像先利用热度图对齐，再匹配。 [10-11]

行人匹配热度图

基于损失函数的方法

基于高层语义信息，设置一些辅助任务，帮助模型学习到好的特征表达。

1. 身份损失（Identification loss）直接拿身份label做多类分类。 [12]

2. 鉴定损失（Verification loss）比较两个输入图像是否为同一人。 [7]

3. 身份损失（Identification loss）+鉴定损失（Verification loss），将以上两种损失函数混合。 [13]

4. 三样本损失（Triplet loss）以3个样本为一组，同一人的图像特征距离应小于不同人。 [14]

5. 加入属性任务（attribute）比如判断是否背包，是男生还是女生等等。人们遇见陌生人也是利用这些属性来描述。 [15]

6. 数据增强混合多数据集训练，加入训练集上生成对抗网络（GAN）生成的数据。 [16-17]

数据集

二维空间数据集

DukeMTMC-reID

该数据集在杜克大学内采集，图像来自8个不同摄像头。该数据集提供训练集和测试集。训练集包含16,522张图像，测试集包含 17,661 张图像。训练数据中一共有702人，平均每类（每个人）有23.5 张训练数据。是最大的行人重识别数据集，并且提供了行人属性（性别/长短袖/是否背包等）的标注。 [18]

DukeMTMC-reID数据集示例

DukeMTMC-attribute

该数据集基于DukeMTMC-reID数据集，加入了行人属性（如性别gender/是否背包bag等23种属性），并且提升了DukeMTMC 行人重识别的效果。 [19]

Market-1501

该数据集在清华大学校园中采集，图像来自6个不同的摄像头，其中有一个摄像头为低像素。同时该数据集提供训练集和测试集。训练集包含12,936张图像，测试集包含19,732 张图像。图像由检测器自动检测并切割，包含一些检测误差（接近实际使用情况）。训练数据中一共有751人，测试集中有750人。所以在训练集中，平均每类（每个人）有17.2张训练数据。 [20]