疲劳驾驶数据集_人工检查，11 个类、97942 个标签，Roboflow 开源自动驾驶数据集可以使用啦...

weixin_39774491

于 2020-11-28 21:34:16 发布

阅读量1.1k

点赞数

文章标签：疲劳驾驶数据集

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39774491/article/details/111372770

版权

机器学习模型需要准确的训练数据，Roboflow发现并修复了Udacity自动驾驶数据集中4986幅图像的错误和遗漏，包括未标记的车辆、行人等。重新发布的数据集包含11个类别，97942个标签，提供多种格式下载，适用于自动驾驶领域的模型训练。

摘要由CSDN通过智能技术生成

机器学习即将带来一系列的社会变革，其中一个被大肆宣传的领域是自动驾驶。但是，伴随着自动驾驶技术的巨大动力而来的是巨大的责任，如果一辆自动驾驶汽车训练的不够好，可能会引发车祸，导致人员伤亡。

这是一个非常危险的问题。

机器学习是通过举例来教计算机算法以执行新任务的过程，但是，ML 模型只能在和它们所训练的数据一样的情况下表现良好。

缺失大量行人和关键标注的自动驾驶数据集问题很大

然而，合适的训练数据集并不是很多。在 github 上有一个广受欢迎的数据集 Udacity(https://github.com/udacity/self-driving-car)，有着 5000+ star，它被成千上万的学生用来构建开源的自动驾驶汽车项目。

对此，Roboflow 的创始人 Brad Dwyer 感到惊讶和担忧，因为这个数据集中包含了很多关键的错误和遗漏。

他们对广泛使用的 Udacity Dataset 2(https://github.com/udacity/self-driving-car/tree/master/annotations) 中的 15000 幅图像进行了手工检查，发现其中 4986 幅(约占总数据量的 33%)存在问题。这些问题包括数以千计辆未贴标签的车辆、数以百计未贴标签的行人和几十个未贴标签的骑自行车的人。他们还发现了许多模糊的注释、重复的边界框和过大的边界框的实例。

错误实例(原始数据集中缺少突出显示的红色注释)

或许最令人震惊的是

最低0.47元/天解锁文章

weixin_39774491

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
疲劳驾驶数据集_人工检查，11 个类、97942 个标签，Roboflow 开源自动驾驶数据集可以使用啦...

机器学习即将带来一系列的社会变革，其中一个被大肆宣传的领域是自动驾驶。但是，伴随着自动驾驶技术的巨大动力而来的是巨大的责任，如果一辆自动驾驶汽车训练的不够好，可能会引发车祸，导致人员伤亡。这是一个非常危险的问题。机器学习是通过举例来教计算机算法以执行新任务的过程，但是，ML 模型只能在和它们所训练的数据一样的情况下表现良好。缺失大量行人和关键标注的自动驾驶数据集问题很大然而，合适的训练数据集并...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。