疲劳驾驶数据集_人工检查,11 个类、97942 个标签,Roboflow 开源自动驾驶数据集可以使用啦...

机器学习模型需要准确的训练数据,Roboflow发现并修复了Udacity自动驾驶数据集中4986幅图像的错误和遗漏,包括未标记的车辆、行人等。重新发布的数据集包含11个类别,97942个标签,提供多种格式下载,适用于自动驾驶领域的模型训练。
摘要由CSDN通过智能技术生成

机器学习即将带来一系列的社会变革,其中一个被大肆宣传的领域是自动驾驶。但是,伴随着自动驾驶技术的巨大动力而来的是巨大的责任,如果一辆自动驾驶汽车训练的不够好,可能会引发车祸,导致人员伤亡。

这是一个非常危险的问题。

机器学习是通过举例来教计算机算法以执行新任务的过程,但是,ML 模型只能在和它们所训练的数据一样的情况下表现良好。

缺失大量行人和关键标注的自动驾驶数据集问题很大

然而,合适的训练数据集并不是很多。在 github 上有一个广受欢迎的数据集 Udacity(https://github.com/udacity/self-driving-car),有着 5000+ star,它被成千上万的学生用来构建开源的自动驾驶汽车项目。

对此,Roboflow 的创始人 Brad Dwyer 感到惊讶和担忧,因为这个数据集中包含了很多关键的错误和遗漏。

他们对广泛使用的 Udacity Dataset 2(https://github.com/udacity/self-driving-car/tree/master/annotations) 中的 15000 幅图像进行了手工检查,发现其中 4986 幅(约占总数据量的 33%)存在问题。这些问题包括数以千计辆未贴标签的车辆、数以百计未贴标签的行人和几十个未贴标签的骑自行车的人。他们还发现了许多模糊的注释、重复的边界框和过大的边界框的实例。

f53a8321631ee2d4d3ef8de01d28b60f.png

错误实例(原始数据集中缺少突出显示的红色注释)

或许最令人震惊的是

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值