SLAM学习--常用数据集

下面列举几个视觉SLAM常用的数据集。

参考链接:

视觉SLAM常用的数据集_编程芝士的博客-CSDN博客_slam数据集

常用的数据集有:KITTI数据集、EuRoC数据集、TUM数据集、Oxford数据集、ICL-NUIM数据集、RGBD Object数据集等等。


KITTI数据集

KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集。该数据集用于评测立体图像(stereo),光流(optical flow),视觉测距(visual odometry),3D物体检测(object detection)和3D跟踪(tracking)等计算机视觉技术在车载环境下的性能。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像中最多达15辆车和30个行人,还有各种程度的遮挡与截断。

下载地址:http://www.cvlibs.net/datasets/kitti/eval_object.php


EuRoC数据集

EuRoC数据集包含11个双目序列,这些序列是由微型飞行器在两个不同的房间和一个大型工业环境中飞行时记录下来的。提供两种类型的数据集: 第一个包含来自Leica多站的三维位置地面真值,并着重于视觉惯性的评估SLAM算法在一个真实的工业场景。

下载地址:kmavvisualinertialdatasets – ASL Datasets


TUM数据集

数据集包含一些室内的序列,在不同的纹理下,不同的光照和不同的结构条件,从RGB-D传感器采集到的数据中分别去评估物体的重建和SLAM/视觉里程计的性能。TUM提供很多数据集,从各个有利位置捕获对象,每个条目中包含图像序列、相应的轮廓和完整的校准参数。

下载地址:Computer Vision Group - Dataset Download


Oxford数据集

对牛津的一部分连续的道路进行了上百次数据采集,收集到了多种天气、行人和交通情况下的数据,也有建筑和道路施工时的数据,总的数据长度达1000小时以上。

下载地址:Oxford RobotCar Dataset


ICL-NUIM数据集

该集旨在对RGB-D、视觉测距和SLAM算法进行基准测试。两个不同的场景(起居室和办公室场景)提供了基本事实。客厅具有3D表面地面实况以及深度图和相机姿势,因此完美地适用于不仅用于标记相机轨迹而且还用于重建。办公室场景仅带有轨迹数据,并且没有任何明确的3D模型。

下载地址:ICL-NUIM RGB-D Benchmark Dataset


RGB-D对象数据集

RGB-D对象数据集是300个常见家庭对象的大型数据集。这些对象被分为51个类别。该数据集使用Kinect风格的3D相机来记录,该相机以30Hz记录同步和对准的640x480 RGB和深度图像。拍摄时将每个物体放置在转盘上旋转一整圈并捕获视频序列。对于每个对象,有3个视频序列,每个视频序列都安装在不同高度的摄像机上,以便从与地平线不同的角度观察对象。

下载地址:RGB-D (Kinect) Object Dataset

3D Model Gallery

Capture, share, and collaborate in immersive 3D

Capture, share, and collaborate the built world in immersive 3D

3D Tour Gallery | Matterport

全球最大的3D数据集公开了!标记好的10800张全景图

Middlebury数据集 http://vision.middlebury.edu/stereo/data/  

全球最大的3D数据集公开了!标记好的10800张全景图 - mydddfly - 博客园

【动态SLAM】动态环境数据集汇总TUM RGB-D数据集由在不同的室内场景使用Microsoft Kinect传感器记录的39 个序列组成https://mp.weixin.qq.com/s?__biz=MzU1NjEwMTY0Mw==&mid=2247552263&idx=1&sn=606b76bdc57ba4b65dcc0974d8ddb4e3&chksm=fbc87463ccbffd75628ce24f1dcbd72f3dd3240b13d15842581d39b245258e64d4db55eb3c43&mpshare=1&scene=23&srcid=04097MfkNzZB6o6GgKy0lS3T&sharer_sharetime=1649509948571&sharer_shareid=a928a59f1cbe91e61cbb0171dae67c99#rd

 

1、TUM数据集

TUM RGB-D数据集由在不同的室内场景使用Microsoft Kinect传感器记录的39 个序列组成。

包含了Testing and Debugging(测试),Handheld SLAM(手持SLAM),Robot SLAM(机器人SLAM),Structure vs. Texture(结构 vs 低纹理),Dynamic Objects(动态物体),3D Object Reconstruction(三维物体重建),Validation Files(验证集),Calibration Files(标定文件)几种针对不同任务的数据集,每个种类有包含多个数据,可以用于多种任务的性能测试。其groundtruth通过光学捕捉系统获得。

其中的Dynamic Objects中包含了9个包含groundtrth的数据集,以及每个每种轨迹的验证集。该数据集涵括了四种相机运动姿态(xyz、rpy、halfsphere、static),以及两种动态程度(sitting、walking)。

该动态数据集被广泛应用于动态SLAM系统的定位精度评估,如DynaSLAM、DsSLAM等都以该数据集为主要评测对象。值得一提的是,该网站还自带了在线评测工具,将自己的轨迹上传即可获得各项指标。

论文:A benchmark for the evaluation of RGB-D SLAM systems


数据集地址:

https://vision.in.tum.de/data/datasets/rgbd-dataset/download

在线测评工具:

https://vision.in.tum.de/data/datasets/rgbd-dataset/online_evaluation

2、KITTI数据集

KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集。该数据集用于评测立体图像(stereo),光流(optical flow),视觉测距(visual odometry),3D物体检测(object detection)和3D跟踪(tracking)等计算机视觉技术在车载环境下的性能。

KITTI数据集的数据采集平台装配有2个灰度摄像机,2个彩色摄像机,一个Velodyne 64线3D激光雷达,4个光学镜头,以及1个GPS导航系统。

其中visual odometry中包含的22个道路环境中采集的双目视频序列,可以用来评估SLAM系统在户外动态环境下的定位性能(以及运动物体跟踪性能)。

目前,包括Dyna SALAMII、VDO-SLAM等著名的户外动态SLAM系统都是用了该数据集进行性能评估。此外,考虑到这些轨迹中有回环的部分,一些研究回环检测的人员制作了某些序列(00、02、05、06、07、08、09、13、15、16、18、19)中的回环真值,可以用来研究动态环境下回环检测的内容。

数据集地址:

http://www.cvlibs.net/datasets/kitti/raw_data.php


回环真值:

http://www.robesafe.com/personal/roberto.arroyo/downloads.html

3、Bonn

ReFusion是一个出色的、不采用深度学技术的、可以运行在动态环境中的三位实时重建系统。在该论文中,他们采集了自己的数据集,包括9种场景的24个视频序列,比TUM动态数据集的场景更加丰富,也更及复杂。

他们用专业的地面激光雷达采集了环境静态部分的高分辨率点云,然后将点云对齐到我们的运动捕捉系统。

之后RGB-D传感器的参考坐标系转换为运动捕捉系统的参考坐标系。目前,该数据集逐渐被一些三位重建的论文所采用。

部分场景如下图所示,可以看到,场景中动态的物体各不相同,而且运动方式也不一样,是极具挑战性的。

论文:ReFusion: 3D Reconstruction in Dynamic Environments for RGB-D Cameras Exploiting Residuals


代码地主:

https://github.com/PRBonn/refusion


数据集地址:

http://www.ipb.uni-bonn.de/data/rgbd-dynamic-dataset/

4、DRE-SLAM论文数据集

DRE-SLAM是一个融合轮式里程计信息和视觉信息的SLAM系统,可以运行在动态的环境下,为轮式差速机器人设计。为了评估该算法的在实际环境中的性能,作者制作并公开了所制作的的数据集。

实验平台为一个装有Kinetc深度相机的轮式机器人Redbot,为了获得该机器人的运动轨迹,作者在房间上方放置了相机来捕获二维轨迹。值得注意的是,该数据集用rosbag tool录制数据,且录制的轨迹仅包含二维平面的运动信息。

作者在论文中提到,其共录制了三种场景(Office、Lib、Corner)、三种状态(Static、Low Dynamic、High Dynamic)共27个数据集,但只公开了Office场景下的9个数据集。

由于论文发布比较晚,且只有平面的运动轨迹,目前使用该数据集的进行评估的论文还比较少。部分场景如下图所示:

5、Dynamic-Scenes

场景中的动态物体不仅会影响SLAM短期的定位精度(帧间运动估计),还会影响长期定位性能(回环检测)。陈等人提出了一种SLCD进行回环检测,并发布了用于户外动态环境下回环检测的数据集。

他们在道路环境中用ZED相机制作了两段数据,包括CBD与Road Ring。

其中CBD的轨迹为一个环形,回环只有一处。Road Ring的轨迹有多处回环,且回环处存在多出动态物体,很适合研究动态动态场景对场景识别的影响。

但是该数据集并没有给相机的参数,且没有轨迹的groungtruth,目前并不能直接使用,可信度并不是很高。


论文:Semantic Loop Closure Detection with Instance-Level Inconsistency Removal in Dynamic Industrial Scenes


数据集地址:

https://github.com/HaoshengChen/Dynamic-Scenes

  • 12
    点赞
  • 79
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值