深度估计数据集合

最新推荐文章于 2024-06-16 10:15:12 发布

流浪机器人

最新推荐文章于 2024-06-16 10:15:12 发布

阅读量3.5k

点赞数

分类专栏：深度估计总结文章标签：深度估计深度数据集 RGBD数据集

本文链接：https://blog.csdn.net/qq_26623879/article/details/103024522

版权

深度估计总结专栏收录该内容

1 篇文章 0 订阅

订阅专栏

深度估计数据集分为室内和室外，根据当前深度估计方法，1.使用视频帧数据集训练，RGB图片对应depth深度;2.使用双目数据训练，Stereo pair左右RGB图像和disparty（视差图）。

室内

NYU-V2

1449张处理好的有标签和补全深度的。
Raw: The raw rgb, depth and accelerometer data as provided by the Kinect. 原始数据，Kinect拍的rgb和depth和加速度计的数据。
Toolbox: Useful functions for manipulating the data and labels.用于处理数据的常用函数。

NYU数据集提取

https://blog.csdn.net/weixin_41864878/article/details/85089644

SUN-RGB-D

虽然RGB-D传感器在三维重建等视觉任务上取得了重大突破，但在高层场景理解方面还没有取得类似的性能提升。可能其中一个主要原因是缺乏一个具有合理规模的基准，其中包括用于训练的3D注释和用于评估的3D度量。提出了一个RGB-D基准套件，目的是提高所有主要场景理解任务的最新水平。我们的数据集由四个不同的传感器捕获，包含10000个RGB-D图像，其比例与PASCAL VOC相似。整个数据集注释密集，包括146617个二维多边形和58657个具有精确对象方向的三维边界框，以及用于场景的三维房间布局和类别。该数据集使我们能够为场景理解任务训练数据饥渴算法，使用直接且有意义的三维度量对其进行评估，避免对小测试集过度拟合，并研究交叉传感器偏差。

Scene Flow Datasets合成数据集

该集合包含39000多个立体声帧，分辨率为960x540像素，由各种合成序列渲染而成。目前有以下几种数据：
在这里插入图片描述

B3DO: Berkeley 3-D Object Dataset

http://kinectdata.com/

GAT5 侠盗飞车数据集

https://www.rockstargames.com/grandtheftauto/

室内RGBD数据集汇总

https://blog.csdn.net/wuguangbin1230/article/details/79986891

室外

KITTI数据集

KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办，是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集。该数据集用于评测立体图像(stereo)，光流(optical flow)，视觉测距(visual odometry)，3D物体检测(object detection)和3D跟踪(tracking)等计算机视觉技术在车载环境下的性能。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据，每张图像中最多达15辆车和30个行人，还有各种程度的遮挡与截断。整个数据集由389对立体图像和光流图，39.2 km视觉测距序列以及超过200k 3D标注物体的图像组成[1] ，以10Hz的频率采样及同步。总体上看，原始数据集被分类为’Road’, ’City’, ’Residential’, ’Campus’ 和 ’Person’。对于3D物体检测，label细分为car, van, truck, pedestrian, pedestrian(sitting), cyclist, tram以及misc组成。

牛津自动驾驶数据集

这一数据集包含牛津大学从 2014 年 4 月到 2015 年 12 月间通过牛津 RobotCar 平台（使用日产 LEAF 自动驾驶汽车）平均每周在牛津市中心运行 10 公里路线产生的数据。总计约 1010 公里驾驶数据，同时包含超过 2000 万张由六台车载相机拍摄的图片，以及激光测距，GPS 和惯性导航收集的地貌资料，容量 23.15TB。
在数据收集期间，车辆完全处于人工驾驶状态。这些数据中存在所有天气情况，包括雨雪，夜间，直射阳光。在数据集收集的一年时间里，车辆运行在同一区域，但这一地区的道路和建筑情况出现了很大改变。通过一年时间频繁地通行在同一路线中，研究人员可以探究在现实世界动态城市环境中自动驾驶车辆如何进行定位和地图映射

自动驾驶nuScenes数据集

nuScenes数据集是自动驾驶公司nuTonomy建立的大规模自动驾驶数据集，该数据集不仅包含了Camera和Lidar，还记录了雷达数据，是我所知道的唯一一个有雷达数据的数据集。
这个数据集由1000个场景组成（即scenes，这就是该数据集名字的由来），每个scenes长度为20秒，包含了各种各样的情景。在每一个scenes中，有40个关键帧（key frames），也就是每秒钟有2个关键帧，其他的帧为sweeps。关键帧经过手工的标注，每一帧中都有了若干个annotation，标注的形式为bounding box。不仅标注了大小、范围、还有类别、可见程度等等。这个数据集不久前发布了一个teaser版本（包含100个scenes），正式版（1000个scenes）的数据要2019年发布。
数据提取:https://blog.csdn.net/weixin_40994913/article/details/83663270

Virtual KITTI dataset

Virtual KITTI是一个照片真实感的合成视频数据集，用于学习和评估计算机视觉模型，以完成多个视频理解任务：目标检测和多目标跟踪、场景级和实例级语义分割、光流和深度估计。
Virtual KITTI包含50个高分辨率单眼视频（21260帧），这些视频是在不同的成像和天气条件下，从城市环境中的五个不同虚拟世界生成的。这些世界是使用Unity游戏引擎和一种新颖的从真实到虚拟的克隆方法创建的。这些照片真实的合成视频是自动的，准确的，完全注释的二维和三维多目标跟踪和像素级的类别，实例，流和深度标签。

CityScapes

下载

该数据集包含如下：images_base和annotations_base分别对应这文件夹leftImg8bit（5,030 items, totalling 11.6 GB，factually 5000 items）和gtFine（30,030 items, totalling 1.1 GB）。里面都包含三个文件夹：train、val、test。总共5000张精细释，2975张训练图，500张验证图和1525张测试图。

https://www.jianshu.com/p/e0cb46a05e2d

流浪机器人

关注

0
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
深度估计数据集合

深度估计数据集分为室内和室外，根据当前深度估计方法，1.使用视频帧数据集训练，RGB图片对应depth深度;2.使用双目数据训练，Stereo pair左右RGB图像和disparty（视差图）。室内NYU-V21449张处理好的有标签和补全深度的。Raw: The raw rgb, depth and accelerometer data as provided by the Kinec...
复制链接

扫一扫