主要参考视频教学:《深度学习和行人重识别》浙江大学罗浩博士
什么是ReID?
一句话就是说,跨多个不重叠监控设备检索特定的行人。是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术,指通过穿着、体态、发型等在不确定的场景中能够再次识别是同一个人,并以此描绘出个体行进轨迹的AI视觉技术,简而言之,就是通过计算机视觉技术检索不同摄像头下的同一个目标人物。
举例:
首先拿到原始监控视频,
然后对行人进行检测(使用行人检测算法),检测出来,
我们就会得到一系列的bounding_boxes,每个人物框都是一张人物图片,可以认为这就组成了一个非常大的图库,
然后给定一张嫌疑犯的照片,我们称之为probe,
拿到嫌疑犯照片之后能够在图库里把他给搜索出来,然后得到他的一些行踪轨迹之类的东西,
他被广泛的认为是一个图像检索的子问题。
特点:
人脸识别目前相对来说准确率是非常高的,但在这些场景中人脸识别可能会失效,不再适用,尤其是远距离监控,就算是拍到人脸,可能也是一张模糊的人脸,ReID看的是一个人的整体特征,包括衣着、配饰、体态等等一些特征,就好像是用我们自己的眼睛看一样。
行人重识别技术可以弥补目前固定摄像头的视觉局限,并可与行人检测、行人跟踪技术相结合。
应用包括:
刑事侦查:比如在全市的监控视频中检索一个小偷的行踪轨迹,
行人理解:要理解一个人的行为,首先要做的是要不断的跟综这个特定的目标行人,意识就是说首先确定这是张三,然后再根据这些行为来理解张三,不能说把这些行为看成是李四的
行人跟踪等等。
主要面临的困难
ReID主要面临的困难包括:分辨率、光亮的变化、不受约束的姿态、遮挡、多模态等等