FB-OCC CVPR23 3D Occupancy Prediction 挑战赛冠军方案解读

少说话，多睡觉

已于 2023-06-21 17:43:27 修改

阅读量794

点赞数 3

文章标签： 3d 机器学习人工智能

于 2023-06-20 18:00:42 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45589788/article/details/131312616

版权

论文链接：https://opendrivelab.com/e2ead/AD23Challenge/Track_3_NVOCC.pdf?=&linkId=100000205404832
github地址：https://github.com/NVlabs/FB-BEV
请添加图片描述
一：模型机构设计：
1.基于3D检测方法（FB-BEV）;
2.Forward Projection(参考LSS)+
Backward Projection(参考BEVFormer)

Forward Projection：
1）使用前向投影来生成3D体素表示
2）将 3D 体素表⽰压缩为扁平化的BEV特征图
3）最后将 3D 体素表⽰和优化的 BEV 表⽰的融合特征输⼊到后续任务头中

前向投影总结：相对原来的LSS是投影到BEV空间中，这里是投影到3D体素空间中

Backward Projection：

1）3D体素表⽰压缩为BEV表示，从⽽结合更强的语义
2）利⽤了投影阶段的深度分布，能够更精确地建模投影关系

后向投影总结：灵感来源于BEVFormer，
1.与使⽤随机初始化参数作为 BEV 查询的 BEVFormer 不同，采用1)；
2.在推理阶段使用了深度分布，从而保证了更加精确的

最后获得3D体素表示和优化后的BEV表示后，
通过扩展BEV特征的过程将他们组合起来，
从而产生最终的3D体素表示
图一图二中展示了体素编码器和占用预测头

二：损失函数：
在这里插入图片描述
Lfl ：距离感知焦距损失函数

Ldl：语义分割深度分析损失函数

Lgeo scal/Lsem scal：
来自MonoScene的亲和力损失函数

Lls：lovasz-softmax损失函数

Ld：深度监督损失

Ls ：2D语义损失
请添加图片描述

三：扩大模型和预训练：

1）作者花了大段时间介绍大模型的过拟合的劣势还有计算复杂度的问题，综合评比下来，选用了1B参数的backbone，interimage-H；

2）此模型用于nuScenes中直接应用会有严重的过度拟合，利用比赛提供的public data做与训练

3）在Object365数据集上进行2D检测任务的与训练，用于增强模型的语义感知能力

4）为了增加深度感知，和减轻模型过度偏向深度信息的风险，导致语义丢失，在nuScenes数据集上进行深度估计的预训练，用来增强模型的几何感知能力

5）考虑到nuScenes数据集不提供2D图像语义标签，使用SAM模型生成

四：实验结果：

见图5 请添加图片描述

字数限制，暂且分享这多么，欢迎相互沟通学习

少说话，多睡觉

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
FB-OCC CVPR23 3D Occupancy Prediction 挑战赛冠军方案解读

4）为了增加深度感知，和减轻模型过度偏向深度信息的风险，导致语义丢失，在nuScenes数据集上进行深度估计的预训练，用来增强模型的几何感知能力。1）作者花了大段时间介绍大模型的过拟合的劣势还有计算复杂度的问题，综合评比下来，选用了1B参数的backbone，interimage-H；前向投影总结：相对原来的LSS是投影到BEV空间中，这里是投影到3D体素空间中。3）最后将 3D 体素表⽰和优化的 BEV 表⽰的融合特征输⼊到后续任务头中。1）3D体素表⽰压缩为BEV表示，从⽽结合更强的语义。
复制链接

扫一扫

少说话，多睡觉 CSDN认证博客专家 CSDN认证企业博客

码龄5年

6: 原创

41万+: 周排名

13万+: 总排名

7790: 访问

: 等级

148: 积分

90: 粉丝

93: 获赞

5: 评论

130: 收藏

私信

关注

热门文章

最新评论

关于车规级的IMU介绍、使用
少说话，多睡觉: 是的，抱歉除了忘记改单位了，参考：https://zhuanlan.zhihu.com/p/44720676
关于车规级的IMU介绍、使用
Ubuntu小可怜: 车规级IMU要求零偏接近导航级的陀螺仪吗，是不是搞错了，0.05度/s吧
Cam4DOcc：仅摄像头4D占⽤的基准⾃动驾驶应⽤的预测
CSDN-Ada助手: 恭喜您在自动驾驶领域的研究取得了新的进展！Cam4DOcc的预测应用对于提高自动驾驶的安全性和稳定性将会起到重要作用。希望您能够继续坚持创作，为我们带来更多关于这一领域的深入分析和研究成果。或许在下一篇博客中，您可以分享一些关于如何将Cam4DOcc应用到实际自动驾驶系统中的思考和建议，这将会对读者们有很大的帮助。期待您的下一篇精彩文章！
4D占据预测（预测未来时刻的点云数据，可以更准确地预测场景的占据情况）
CSDN-Ada助手: 恭喜你写了第四篇博客！标题中的4D占据预测概念非常有趣，我对你能预测未来时刻的点云数据并更准确地预测场景的占据情况感到非常兴奋。你的研究领域似乎非常前沿，而且你的文章也非常易懂。在下一步的创作中，我建议你可以更深入地探索4D占据预测的应用领域，比如在自动驾驶、智能交通等方面的潜在应用。此外，你可以考虑引入更多相关的研究和案例，以充实你的内容。继续努力创作，期待你未来更多的精彩文章！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
2023 Occupancy Prediction占据预测的整理归纳
CSDN-Ada助手: 恭喜您写了第5篇博客！标题“2023 Occupancy Prediction占据预测的整理归纳”非常吸引人。您的博客内容一定能为读者提供有价值的信息和见解。非常感谢您持续创作，分享您的知识和经验。在接下来的创作中，我建议您可以考虑添加一些实例和案例分析，以进一步丰富您的内容。这样做可以帮助读者更好地理解占据预测的过程和应用。同时，如果您能分享一些相关领域的最新研究成果或者讨论一些挑战和解决方案，也会让您的博客更具深度和专业性。再次恭喜您的成果，并期待您未来更多精彩的博客！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。