行人Reid的入门基本知识

最新推荐文章于 2024-07-16 13:34:36 发布

三度就好

最新推荐文章于 2024-07-16 13:34:36 发布

阅读量1.6k

点赞数 4

分类专栏： reid 深度学习

本文链接：https://blog.csdn.net/yxr403614258/article/details/103785598

版权

深度学习同时被 2 个专栏收录

21 篇文章

订阅专栏

reid

8 篇文章

订阅专栏

0. 国际惯例，名词解释。

行人Reid，行人重识别。即在同一或不同摄像头下通过对行人检测框的图像进行feature提取、match等来判断两张图或多张是不是同一个人。既然是判断哪个是真孙悟空，那就得有真孙悟空的照片吧，就是groundtruth，在reid中叫query image。那些待验真身的图片叫做gallery image。通俗的来完了，还是得要官方的解释下：

gallery set –—参考图像集，即公认的标准行人库，测试用；

query set —– 待查询图像集，测试用

很拗口，推荐不看。

1.数据集

炼丹嘛，没数据怎么搞。

Market-1501、CUHK03、DukeMTMC-reID，MSMT17是SOTA衡量Re-ID技术的比较主流的数据集。大致介绍下几大数据集：

1.1 Market-1501

基本可以说是最早，也是大家paper用的最多的数据集了。

官方是这么说的：

该数据集在清华大学校园中采集，图像来自6个不同的摄像头，包含5个高分辨率（1280x1080 HD，fps: 25）和1个低分辨率（720x576 SD，fps: 25）；
该数据集有1501个类别，共36036张图片，其中训练集有751个ID：共12936张，测试集有750个ID：共19732张。所以在训练集中，每个ID平均有17.2张训练图片，在测试集中，每个ID平均包含26.3张图片；
每个类别的图片最多能被六个摄像头捕捉，最少能被两个摄像头捕捉；
在开放环境中,多摄像头组成的捕捉系统使样本包含多种属性、信息和环境背景；
Market-1501数据集的图像是由检测器自动检测并切割，包含一些检测误差，较为接近真实使用情况。
ref：http://www.liangzheng.org/Project/project_reid.html

--market1501文件结构

"bounding_box_train" – 751个ID，12936张图片，训练集；
"bounding_box_test" – 750个ID，19732张图片，测试集，也是所谓的gallery参考图像集；
"query" – 750个ID，共3368张图片，即待查询图片。test中750个ID在每个摄像头中随机选择一张图像作为query，因此一个ID的query最多有 6 个，ps：与test中的图不重复，在参考建立自己的数据集时，可以先建好test，然后按需要从test中剪切得到query；
"gt_query" – bla bla...个人感觉没什么用
"gt_bbox" – bla bla...个人感觉没什么用

--命名规则