BDD100K：一个大规模、多样化的驾驶视频数据集

最新推荐文章于 2025-04-14 10:31:48 发布

jocelyn427

最新推荐文章于 2025-04-14 10:31:48 发布

阅读量3.3w

点赞数 16

分类专栏： BDD100K数据集文章标签：目标检测

BDD100K数据集专栏收录该内容

2 篇文章

订阅专栏

官网：http://bair.berkeley.edu/blog/2018/05/30/bdd/
数据集下载地址：http://bdd-data.berkeley.edu.
论文下载地址：https://arxiv.org/abs/1805.04687

近日，伯克利大学AI实验室（BAIR）发布了目前最大规模、内容最具多样性的公开驾驶数据集BDD100K，同时设计了一个图片标注系统（Labeling System 的介绍见论文）。BDD100K 数据集包含10万段高清视频，每个视频约40秒，720p，30 fps 。每个视频的第10秒对关键帧进行采样，得到10万张图片（图片尺寸：1280 * 720 ），并进行标注。
这里写图片描述

一、Annotations

1、道路目标边界框：10万张图片
其中：训练集7万，测试集2万，验证集1万
2、可行驶区域：10万张图片
3、车道线标记：10万张图片
4、全帧实例分割：1万张图片

Annotation包含了被标记对象的：
源图像的URL、类别标签、大小（起始坐标、结束坐标、宽度和高度）、截断、遮挡和交通灯颜色等信息。

二、 Image Tagging

（一）标签类别

数据集中的GT框标签共有10个类别，分别为：Bus、Light、Sign、Person、Bike、Truck、Motor、Car、Train、Rider。总共约有184万个标定框，不同类型目标的数目统计如图1所示。
这里写图片描述
其中小车（Car一类）就超过了100万个样本。平均而言，每张图片约9.7辆车，1.2个人。尤其是，行人的数量多于之前的数据集，具体数目如图2所示（统计是基于各数据集中的训练集的）。