点击上方“3D视觉工坊”,选择“星标”
干货第一时间送达
来源丨计算机视觉深度学习和自动驾驶
2022年3月arXiv论文“CODA: A Real-World Road Corner Case Dataset for Object Detection in Autonomous Driving“,华为和香港、广州两所大学一起发表。
大多数现有的检测器无法检测到不常见的目标和极端情况(例如,狗过马路),在某些情况下可能导致严重事故,使得可靠自动驾驶的实际应用时间表变得不确定。阻碍开发真正可靠的自动驾驶系统的一个主要原因是缺乏公共数据集来评估极端情况下目标检测器的性能。因此这里引入了一个CODA的挑战性数据集,该数据集揭示了基于视觉检测器的关键问题。该数据集由 1500 个精心挑选的真实世界驾驶场景组成,每个场景包含四个目标级的极端案例(平均),跨越 30 多个目标类别。在大规模自动驾驶数据集上训练的标准目标寄存器在CODA的mAR表现显着下降到不超过12.8%。
此外,采用最先进的开放世界目标检测器进行实验,发现无法可靠地识别CODA中的新目标,这表明用于自动驾驶的强大感知系统可能还遥不可及。CODA数据集期望能促进对真实世界自动驾驶可靠检测的进一步研究。
数据集网址:https://coda-dataset.github.io
如图是CODA和其他公开数据集的检测结果比较:
该图是CODA的一些例子:
CODA中场景是从三个大型自动驾驶数据集中精心挑选的:KITTI 、nuScenes 和ONCE,一共为CODA贡献了1500个不同的场景,每个场景至少包含一个对自动驾驶汽车或其周围生活和资产有害的目标级极端案例。极端情况通常可以分为7个超级类别:车辆,行人,骑自行车,动物,交通设施,障碍物和杂项,如图列出的是下面34个细分类别:
用于确定目标是否为极端情况的主要标准如下:
风险:目标阻挡或即将阻挡自动驾驶汽车的潜在路径。不在道路上的静态目标,如树木和建筑物,不被视为阻挡。
新颖性:该目标不属于任何通用类的通用驾驶基准,或者它是通用类的新实例。为简单起见,把SODA10M的类作为通用类。
CODA的数据集建设分两个主要阶段进行。第一阶段是自动生成提议,从初始数据中识别潜在的极端情况,然后第二阶段,手动选择和标记过程,消除提议误报,对剩余的真目标进行分类,同时调整其边框使其更精确。
下图是用于生成极端案例提议(COPG)的流水线。流水线输入是给定场景的点云和图像。点云用于计算(a),而图像(b)用于生成(c)和(d),这有助于删除无效的提议。输出(g)是一组边框,指示图像中提议的极端情况。
下表是与其他道路异常数据集的比较。与CODA相比,其他数据集要么是合成的,要么是小规模的。BDD-Anomaly (v1) 是现实世界中最大的一个道路异常集,尽管它在实例数量上与 CODA 相当,但只包含两个目标类。
下表是CODA上的检测结果:
下图是COPG的提议和标注例子:
下表是COPG和其他非正常/目标检测器的评估:
本文仅做学术分享,如有侵权,请联系删文。
干货下载与学习
后台回复:巴塞罗那自治大学课件,即可下载国外大学沉淀数年3D Vison精品课件
后台回复:计算机视觉书籍,即可下载3D视觉领域经典书籍pdf
后台回复:3D视觉课程,即可学习3D视觉领域精品课程
3D视觉精品课程推荐:
2.面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码)
3.彻底搞透视觉三维重建:原理剖析、代码讲解、及优化改进
4.国内首个面向工业级实战的点云处理课程
5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解
6.彻底搞懂视觉-惯性SLAM:基于VINS-Fusion正式开课啦
7.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化
8.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)
重磅!3DCVer-学术论文写作投稿 交流群已成立
扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。
同时也可申请加入我们的细分方向交流群,目前主要有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。
一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。
▲长按加微信群或投稿
▲长按关注公众号
3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、激光/视觉SLAM、自动驾驶等)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近5000星球成员为创造更好的AI世界共同进步,知识星球入口:
学习3D视觉核心技术,扫描查看介绍,3天内无条件退款
圈里有高质量教程资料、答疑解惑、助你高效解决问题
觉得有用,麻烦给个赞和在看~