作者 | 自动驾驶专栏 编辑 | 自动驾驶专栏
点击下方卡片,关注“自动驾驶之心”公众号
戳我-> 领取自动驾驶近15个方向学习路线
本文只做学术分享,如有侵权,联系删文
论文链接:https://arxiv.org/pdf/2408.13454
代码链接:https://github.com/ai4ce/Bosch-NYU-OccupancyNet/
摘要
本文介绍了AdaOcc:自适应分辨率占用预测。在复杂的城市场景中实现自动驾驶需要3D感知既全面又精确。传统的3D感知方法着重于目标检测,导致缺乏环境细节信息的稀疏表示。最近的方法估计车辆周围的3D占用,以获得更全面的场景表示。然而,稠密的3D占用预测提高了计算需求,给效率和分辨率之间的平衡带来挑战。高分辨率占用栅格提供了准确性,但是需要大量的计算资源,而低分辨率栅格效率高,但是缺乏细节信息。为了解决这一难题,本文引入了AdaOcc,这是一种新的自适应分辨率、多模态的预测方法。本文方法将以目标为中心的3D重建和整体占用预测集成到一个框架内,仅在感兴趣区域(ROIs)内进行高度精细且精确的3D重建。这些高度精细的3D表面以点云表示,因此其精度不受占用地图的预定义栅格分辨率所限制。本文在nuScenes数据集上进行全面实验,证明了相比于现有方法具有显著改进。在近距离场景中,本文方法在IOU上超过先前的基线13%,在Hausdorff距离上超过了40%。总之,AdaOcc提供了更通用、更有效的框架,能够在各种驾驶场景中提供准确的3D语义占用预测。
主要贡献
本文的贡献总结如下:
1)本文提出了一种多模态自适应分辨率方法,在关键区域中提供了三种高精度的输出表示,同时维持实时应用的效率;
2)本文开发了一种有效的联合训练范式,可以增强占用预测和目标折叠分支之间的协同作用;
3)本文方法在nuScenes数据集上展现出卓越的精度,特别是在需要精确行为的近距离场景中表现出色。
论文图片和表格
总结
总之,本文所提出的方法提供了一种多模态自适应分辨率方法,在关键区域中提供了三种具有高精度表面的输出表示,同时确保了实时应用的效率。此外,本文还开发了一种有效的联合训练范式,以增强占用和折叠网络之间的协同作用,从而提高近距离占用预测的性能。本文方法在nuScenes数据集上展现出卓越的精度,突出了对精细表面重建的注重。
局限性:本文发现,联合训练方法没有显著提高目标检测任务的质量。需要进一步研究粗略占用预测和目标表面重建之间的相互作用,以提高不同表示之间的一致性。此外,通过更高级的并行化设计,能够进一步优化统一框架的效率。
投稿作者为『自动驾驶之心知识星球』特邀嘉宾,欢迎加入交流!重磅,自动驾驶之心科研论文辅导来啦,申博、CCF系列、SCI、EI、毕业论文、比赛辅导等多个方向,欢迎联系我们!
① 全网独家视频课程
BEV感知、BEV模型部署、BEV目标跟踪、毫米波雷达视觉融合、多传感器标定、多传感器融合、多模态3D目标检测、车道线检测、轨迹预测、在线高精地图、世界模型、点云3D目标检测、目标跟踪、Occupancy、cuda与TensorRT模型部署、大模型与自动驾驶、Nerf、语义分割、自动驾驶仿真、传感器部署、决策规划、轨迹预测等多个方向学习视频(扫码即可学习)
网页端官网:www.zdjszx.com② 国内首个自动驾驶学习社区
国内最大最专业,近3000人的交流社区,已得到大多数自动驾驶公司的认可!涉及30+自动驾驶技术栈学习路线,从0到一带你入门自动驾驶感知(2D/3D检测、语义分割、车道线、BEV感知、Occupancy、多传感器融合、多传感器标定、目标跟踪)、自动驾驶定位建图(SLAM、高精地图、局部在线地图)、自动驾驶规划控制/轨迹预测等领域技术方案、大模型、端到端等,更有行业动态和岗位发布!欢迎扫描下方二维码,加入自动驾驶之心知识星球,这是一个真正有干货的地方,与领域大佬交流入门、学习、工作、跳槽上的各类难题,日常分享论文+代码+视频
③【自动驾驶之心】技术交流群
自动驾驶之心是首个自动驾驶开发者社区,聚焦感知、定位、融合、规控、标定、端到端、仿真、产品经理、自动驾驶开发、自动标注与数据闭环多个方向,目前近60+技术交流群,欢迎加入!扫码添加汽车人助理微信邀请入群,备注:学校/公司+方向+昵称(快速入群方式)
④【自动驾驶之心】全平台矩阵