SUN RGB-D数据集的理解

最新推荐文章于 2025-02-22 17:15:26 发布

Z-Jeff

最新推荐文章于 2025-02-22 17:15:26 发布

阅读量1.5w

点赞数 15

分类专栏： 3D Object Detection

本文链接：https://blog.csdn.net/Jeff_zjf/article/details/106743231

版权

3 篇文章

订阅专栏

SUN RGB-D数据集是普灵斯顿大学的 Vision & Robotics Group 公开的一个有关场景理解的数据集。

官方介绍在此，其中有视频介绍。视频介绍已经很详细了，建议先看懂视频。

此博客仅仅列出个人认为的一些理解要点，如有错误，欢迎指正。

通过四款3D摄像机采集图像和深度信息：

这四款相机均含有色彩传感器+红外发射器+红外接收器。其中色彩传感器获取RGB信息，红外发射器+红外接收器获取深度信息。

从数据上来看，RGB和深度信息是分开存放的。

如下图所示，左边是一副彩色图片，包含RGB信息，右边是一副灰度图片，其灰度值代表着深度信息：

一般而言，使用不同相机拍摄出来的彩色图片，差别不会太大。但由于硬件和算法上的差异，不同3D相机得出的深度估计差别较大，这是我们需要认识到的一个变量。

使用笔记本电脑+移动电源+相机的方式，方便在不同场景下做数据采集，见下图：

每份数据标注了：

SUN RGB-D 数据集包含10,335张不同场景的室内图片，146,617个2D多边形标注(应该指的是2D分割)，和58,657个3D边框。

将SUN RGB-D的数据量级与PASCAL VOC2017的数据量级作对比：

就图片数量而言，SUN RGB-D与PASCAL VOC2017有着相同的量级，适合训练数据驱动模型，并适合作为一种评价基准。