我们给出以下的分类标准: 1. 数据模式。数据模式是指用于捕获人机交互的数据类型。最常见的数据模式是: 单目 RGB:指使用单个 RGB 相机捕获场景。这是最具挑战性的模式,因为它需要从单个 2D 图像中推断 3D 信息。 单目 RGB-D