本文引自:https://analyticsindiamag.com/top-10-popular-datasets-for-autonomous-driving-projects/
前言
近几年来,各机构一直在自动驾驶领域投入巨资。这一支出背后的原因预计将以积极的方式重塑交通网络。据报道,到2024年,全球自动驾驶汽车市场的CAGR预计将加速增长62.86%,达到412.4亿美元。
数据集
在本文中,我们列出了10个流行的自动驾驶项目数据集。这个名单是按字母顺序排列的。
1. Astyx Dataset HiRes2019
Astyx HiRes2019数据集是一个流行的汽车雷达数据集,用于基于深度学习的3D对象检测。开源该数据集的动机是为研究社区提供高分辨率的雷达数据,促进和激励使用雷达传感器数据的算法的研究。该数据集是以雷达为中心的自动数据集,基于雷达、激光雷达和摄像机数据,用于三维目标检测。数据集的大小超过350 MB,由546帧组成。
下载地址: https://www.astyx.com/development/astyx-hires2019-dataset.html
2. Berkeley DeepDrive(BDD100K)
加州大学伯克利分校的Berkeley DeepDrive数据集由超过100K的视频序列组成,包含各种各样的注释,包括图像级标记、对象边界框、可行驶区域、车道标记和全帧实例分割。数据集具有地理、环境和天气多样性,这对于训练模型很有用,因此外部环境对识别结果影响较小。
下载地址:https://bdd-data.berkeley.edu/
3. Landmarks
谷歌开放源码的这个数据集,用于识别人造和自然地标。该数据集将作为2018年Kaggle挑战的一部分发布。它包含了200多万张图片,描绘了来自世界各地的3万个独特的地标(它们的地理分布如下图所示),这类图片的数量是常用数据集的30倍。
下载地址:https://ai.googleblog.com/2018/03/google-landmarks-new-dataset-and.html
4. Landmarks-v2
在2018年发布地标数据集之后,科技巨头谷歌于2019年发布了谷歌地标-v2数据集。由于识别尺度的不同,这个地标识别数据集比之前版本的数据集更大,也更多样化。它包含了超过500万张不同地标的图片(是第一版的2倍)。
下载地址:https://ai.googleblog.com/2019/05/announcing-google-landmarks-v2-improved.html
5. Level 5
拼车公司Lyft公开了Level 5的数据集。Level 5是一个全面的、大规模的数据集,具有原始传感器摄像头和激光雷达输入,由多个高端自动驾驶车辆组成的车队在一个受限制的地理区域采集环境数据。数据集还包括人类标记的交通标志的三维边界框,一个底层的高清空间语义地图。
下载地址:https://level5.lyft.com/dataset/?source=post_page
6. nuScenes Dataset
nuScenes是一个用于自动驾驶的大型公共数据集。该数据集使研究人员能够使用真实自动驾驶汽车的完整传感器套件来研究城市驾驶情况。数据集包括140万幅相机图像,39万幅激光雷达扫描,详细的地图信息,完整的传感器套件,如1x激光雷达,5x雷达,6x相机,IMU, GPS等。
下载地址:https://www.nuscenes.org/
7. Open Images V5
Open Images V5是一个包含900多万张图像的数据集,这些图像都带有跨越数千个对象类别的标签。开放图像V5数据集具有350组280万个对象实例的分割标签。该数据集包括训练集上的268M分割标签、超过20k类别的3650M图像级标签以及验证集和测试集上的99K标签。
下载地址:https://ai.googleblog.com/2019/05/announcing-open-images-v5-and-iccv-2019.html
8. Oxford Radar RobotCar Dataset
牛津的RobotCar数据集由超过100个英国牛津的路线组成,这些路线已经被捕捉了一年多。数据集是天气、交通和行人的许多不同组合,以及建筑和道路工程等长期变化的组合。
下载地址:https://robotcar-dataset.robots.ox.ac.uk/
9. Pandaset
Pandaset是一个流行的大规模自动驾驶数据集。该数据集使研究人员能够研究自动驾驶,旨在促进自动驾驶和机器学习的先进研究和发展。数据集有6个摄像头,2个激光雷达,28个注释类,37类分割标签等等。
下载地址:https://scale.com/open-datasets/pandaset
10. Waymo Open Dataset
Waymo开放数据集是一个用于自主驾驶的开源高质量多模态传感器数据集。该数据集是从Waymo自动驾驶汽车中提取的,涵盖了从密集的城市中心到郊区景观的各种环境。这个系列由不同的时间组成,包括阳光、雨水、白天、夜晚、黎明和黄昏。它包含1000种不同的片段,每个片段捕获20秒,相当于每个传感器20万帧。