单目深度估计数据集：NYU Depth Dataset V2

最新推荐文章于 2024-06-16 10:15:12 发布

李是李雅普诺夫的李

最新推荐文章于 2024-06-16 10:15:12 发布

阅读量3.5k

点赞数

分类专栏：深度学习文章标签：计算机视觉机器学习深度学习人工智能图像识别

本文链接：https://blog.csdn.net/qq_41742361/article/details/116328687

版权

4 篇文章 1 订阅

订阅专栏

打不开或者下载慢的可以用这个，【链接】用了两年了一直挺好用的。

Samples of the RGB image, the raw depth image, and the class labels from the dataset.

NYU-Depth V2数据集由各种室内场景的视频序列组成，该数据集是使用Microsoft Kinect的RGB和深度相机采集的。它具有以下特点：

数据集包括以下几个部分：

RGB相机的输出（左），预处理深度（中心）和图像的一组标签（右）。

标注数据集是原始数据集中的子集。它由一对RGB图像和深度图像组成，每张图像都经过精细的标注。除了投射采集到的深度图，还包含了一组预处理的深度图，这些深度图采用Levin等人的着色方案补全了缺失的深度标注。与原始数据集不同，标注数据集的文件格式为Matlab.mat，具有以下参数：

accelData：Nx4的加速度计值矩阵，用来显示每一帧是何时采集的。矩阵的列为设备的滚动觉，偏航角，俯仰角和倾斜角。
depths：绘制深度图的HxWxN矩阵，其中H和W分别是高度和宽度，N是图像序号。深度元素的值以米为单位。
images：HxWx3xN的RGB图像矩阵，其中H和W分别是高度和宽度，3为通道数，N是图像序号。
instances：HxWxN的实例分割图像矩阵。在工具箱中使用get_instance_masks.m可以恢复场景中每个对象实例的蒙版。
labels：HxWxN的对象标注蒙版矩阵，其中H和W分别是高度和宽度，N是图像序号。标注的范围是1~C，其中C是类别的总数。如果像素的标签值为0，则该像素为“未标注”。
names：Cx1数组，每种标签的名称。
namesToIds：从英文标签名称到类别序号的映射（C个映射对）
rawDepths：原始深度图的HxWxN矩阵，其中H和W分别是高度和宽度，N是图像序号。在投影到RGB图像平面之后、补全丢失深度值之前，这些depth maps捕获深度图像。
rawDepthFilenames：文件名的Nx1单元格数组（在Raw数据集中），用于标记的数据集中的每个深度图像。
rawRgbFilenames：标签数据集中用于每个RGB图像的文件名（在Raw数据集中）的Nx1数组。
scenes：拍摄每张图像的场景名称的Nx1数组。
sceneTypes：拍摄每个图像的场景类型的Nx1数组。

关注

专栏目录