本文介绍澳洲国立大学郑良老师实验室在ECCV 2020上的新工作《Multiview Detection with Feature Perspective Transformation》。一直以来,遮挡问题严重影响了识别、检测等诸多计算机视觉系统的性能。在这篇文章中,作者提出的MVDet模型通过联合考虑多个相机,极大缓解了遮挡对检测系统的影响;此外,文章还提出了一个新的仿真数据集MultiviewX。此外,文章中提出的多相机检测模型,也可以应用在保持社交距离(social distancing)中,对抗击疫情提供技术上的支持。
题目:Multiview Detection with Feature Perspective Transformation
作者:Yunzhong Hou, Liang Zheng, Stephen Gould真实数据集Wildtrack上效果可视化仿真数据集MultiviewX上效果可视化
多相机(multi-view)系统上:多相机(multi-view)输入。其中红圈内人群被严重遮挡,一般单目检测系统难以识别。下:地面上(鸟瞰),多个相机的视野(field of view)交集。
在一个多相机系统中,包含多个同步、有公共视野、标定好的相机。在多相机检测系统中,由于相机参数已知,可以通过假设行人3D包围框(3D bounding box)的直径和高度,计算得到每个相机中的2D包围框(2D bounding box)。因此,多相机检测一般在地面(俯瞰)上评估行人的检测效果。利用多相机进行检测,有两个亟待解决的问题:如何联合考虑多