BEV核心思想
将相机视角转化为BEV视角下,解决相机视角缺失深度的问题。
问题的关键在于如何从相机视角转化为BEV视角。
经典方法:
2D到3D
- LSS。Lift Splat Shoot。经典方案。后续工作CaDNN、FIERY、BEVDet、BEVFusion、BEVDepth
- Pseudo-Lidar。使用伪点云的方案。
深度估计依赖于摄像机的外参,解决思路是标准为一个虚拟的摄像机,这样可以更好的泛化。
3D to 2D
- DETR3D
数据集
nuscenes榜单
https://www.nuscenes.org/object-detection?externalData=all&mapData=all&modalities=Camera
论文汇总:
所有相关论文等paper和代码,没有做分类
https://github.com/chaytonmin/Awesome-BEV-Perception-Multi-Cameras
BEV感知汇总:
包含论文、工具、家族等
https://github.com/OpenDriveLab/Birds-eye-view-Perception
论文综述:
一直在更新,可以系统的看BEV论文。
Vision-Centric BEV Perception: A Survey(一直在持续更新)
最新的“视觉为中心的BEV感知”综述论文 - 黄浴的文章 - 知乎
https://zhuanlan.zhihu.com/p/553588646
最新论文:BEV感知的综述、评估和对策 - 黄浴的文章 - 知乎
https://zhuanlan.zhihu.com/p/565212506
参考资料:【环视BEV感知:下一代自动驾驶感知算法新范式,BEVFormer、BEVFormer++、BEVFusion等系列算法分享】 https://www.bilibili.com/video/BV1A34y1W7Lu/?share_source=copy_web&vd_source=a641d5fd36f9ab534df883ec3f1ed48f