大数据文摘出品
作者:宁静、曹培信
7月4日举办的百度开发者大会上,李彦宏宣布百度L4级自动驾驶路测里程破两百万公里,百度的level4自动驾驶已经发展到了一个新的阶段。
自动驾驶依赖高度精确的目标检测能力,以应对路上可能出现的各种情况,而想训练一个完善的目标检测模型,则需要大量的车载传感器提供的数据。所以说百度在自动驾驶方面取得的成就,基础就是那两百万公里的路测数据。
许多想尝试做目标识别的机构或者个人,都苦于无法获取足够的数据而无法进行相关研究。
最近,Lyft公司专注于自动驾驶的Lyft level5团队公开了一组他们采集的数据集,并且预计在12月举办一次基于该数据集的比赛,数据集一共将近60G,注册一个账户即可下载。
数据来之不易
该数据集包括高质量的语义图, 语义图提供关于场景中车辆位置和移动方向的上下文推理,所有地图元素都映射到基础几何图,是数据集中所有场景的相同参照系。
提供的地图有超过4000个车道段(2000个路段车道和约2000个车道),197个人行横道,60个停车标志,54个停车区,8X减速带,11X减速带。
所有数据均采集于福特Fusion车队, 每辆车都配有以下传感器:
激光雷达:
-
一个安装在车顶的40束激光雷达和两个安装在保险杠的40束激光雷达;
-
每个雷达的方位角分辨率为0.2度;
-
所有三个激光雷达共同产生约216,000个点,频率为10赫兹;
-
所有雷达的发射方向在任何给定时间都是相同的。
摄像头:
-
六个宽视角(WFOV)摄像机均匀覆盖360度视角(FOV), 每台相机的分辨率为1224x1024,FOV为70°x60°;
-
一个长焦距摄像头略微向上安装,主要用于检测交通信号灯,相机的分辨率为2048x864,FOV为35°x15°;
-
每个摄像机与雷达同步,使得当摄像机捕获图像时,雷达光束位于摄像机视野的中心。
数据格式
选用nuScenes format用于数据集,以确保与使用nuScenes数据集完成的现有工作兼容。
关于nuScenes format链接:
https://www.nuscenes.org/data-format
为了探索和使用数据集,下面提供nuScenes devkit的自定义版本以及如何使用它的教程:
-
通过下方链接登陆和下载数据集;
https://level5.lyft.com/register/
-
下载Lyft版本的NuScenes SDK;
-
按照README.md设置SDK并开始处理数据。
关于lyft level5
Lyft level5是Lyft公司下专注于开发自动驾驶的团队,他们目前正在开发Level 4自动驾驶技术,目标是实现完全自主的自动驾驶技术。
他们通过Lyft公司驾驶服务的便利,每周可获得1000万辆次的驾驶数据用于模型训练,同时还探索人类司机和自动驾驶共存的路面网络架构。
Lyft level5团队包括300多名工程师、应用研究人员、产品经理、运营经理等。其中不乏是世界上顶级的计算机视觉、机器人技术和机器学习专家,还有一些是参加过Kaggle的顶尖大师。
相关报道:
https://level5.lyft.com/dataset/