参考:带你玩转 3D 检测和分割 (二):核心组件分析之坐标系和 Box - 知乎
MMDetection3D定义:选择一个轴作为重力轴(y 轴),在垂直于重力轴的平面上选择一个参考方向(x轴,朝向角 yaw 为 0),其他方向的朝向角yaw为与x轴的角度。
MMDetection3D三大坐标系:
构建 Box:
如上图所示,假设物体的长宽高分别为 l, w, h, 其朝向为如图所示,我们可以根据上述的定义表示该物体 3D 框在各个坐标系下的值,这里我们默认三个坐标系原点是重合的:
- 激光雷达坐标系:该物体底部中心点坐标为
(l/2, w/2, 0)
,朝向和 x 轴的夹角为 0,即 yaw 角为 0,所以该坐标系下 Box 的值为(l/2, w/2, 0, l, w, h, 0)
。 - 深度坐标系:该物体底部中心点坐标为
(-w/2, l/2, 0)
,此时朝向和 x 轴的夹角为 90 度,即 yaw 角为pi/2
,需要注意的是,为了获得x_size, y_size, z_size
, 我们需要将物体旋转到和 x 轴平行,此时沿着x-y-z
三个轴方向的长度分别为l、w、h
,所以该坐标系下的 Box 的值为(-w/2, l/2, 0, l, w, h, pi/2)
。 - 相机坐标系:该物体底部中心点坐标为
(-w/2, 0, l/2)
, 此时朝向和 x 轴的夹角为 90 度,需要注意的是,根据前面的定义 yaw 角为-pi/2
,同样的为了获得x_size, y_size, z_size
, 我们需要将物体旋转到和 x 轴平行,此时沿着x-y-z
三个轴方向的长度分别为l、h、w
,所以该坐标系下的 Box 的值为(-w/2, 0, l/2, l, h, w, -pi/2)
。