在真实的三维世界中,物体都是有三维形状的,许多应用都需要有目标物体的长宽高还有偏转角等信息。以自动驾驶为例,在自动驾驶场景下,需要从图像中提供目标物体三维大小及旋转角度等指标,鸟瞰投影的信息对于后续的路径规划和控制具有至关重要的作用。我们将使用RGB图像、RGB-D深度图像和激光点云,输出物体类别及在三维空间中的长宽高、旋转角等信息的检测称为3D目标检测。
多类别目标的检测问题可以转换为“某类物体检测正确、检测错误”的二分类问题,从而可以构造混淆矩阵,使用目标分类的一系列指标评估模型精度,例如:使用Precision-Recall曲线定性分析模型精度,使用average precision(AP)定量分析模型精度;对于物体方向检测,可以采用Average Orientation Similarity (AOS)来衡量检测结果与Ground truth的方向相似程度。
下面具体介绍3D目标检测任务的常用评价指标。
IoU(Intersection over Union)
- 定义:交并比,即预测框和真值框的交集与并集之比
IoU有三种计算方式:
(1)2D IoU:将3D检测结果框映射回2D的Image View
(2)3D IoU:直接在3D空间计算