论文阅读笔记：(2020.06 cvpr_w) SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint Estimation

最新推荐文章于 2023-04-03 20:21:02 发布

chaoqinyou

最新推荐文章于 2023-04-03 20:21:02 发布

阅读量1.8k

点赞数

分类专栏：感知文章标签：目标检测 3d 自动驾驶

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chaoqinyou/article/details/122357395

版权

感知专栏收录该内容

19 篇文章 1 订阅

订阅专栏

单目3D目标检测算法对自动驾驶领域非常重要，SMOKE是2021年CVPR workshop的文章，精度在kitti上排名前列，能实现实时推理，且代码开源，最近也被baidu apollo7.0集成到了感知模块，非常值得学习！

paper: https://openaccess.thecvf.com/content_CVPRW_2020/html/w60/Liu_SMOKE_Single-Stage_Monocular_3D_Object_Detection_via_Keypoint_Estimation_CVPRW_2020_paper.htmlhttps://openaccess.thecvf.com/content_CVPRW_2020/html/w60/Liu_SMOKE_Single-Stage_Monocular_3D_Object_Detection_via_Keypoint_Estimation_CVPRW_2020_paper.html代码：https://github.com/lzccccc/SMOKEhttps://github.com/lzccccc/SMOKE

精度对比（截止2022.01）：

(KITTI Cars Moderate Benchmark (Monocular 3D Object Detection) | Papers With Code)

主要观点和贡献：

1. 认为检测2D框会给3D检测带来噪声，是冗余的，所以用Keypoint的方式直接回归3D框；

实现方式：

a. backbone: 基于DLA-34进行改造，用了DCN和GN进行改造；

b. head:

关键点分支：每个类别一层;

3d box: 预测，其中：

c. loss:

关键点分支：penalty-reduced focal loss:

3d box 分支：

把预测的三个量分为三组（比如中心点，尺寸， yaw，具体我要看一下代码）；

每组中其余的值用gt，然后再转换成3d框的8个点，在放到L_reg中；

目的应该是把预测的量解耦，降低预测难度；

文中提到的一些比较有价值的参考文献（个人认为）：

(2019 iccv) Disentangling Monocular 3D Object Detection

(2019 cvpr) ROI-10D: Monocular Lifting of 2D Detection to 6D Pose and Metric Shape

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
论文阅读笔记：(2020.06 cvpr_w) SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint Estimation

单目3D目标检测算法对自动驾驶领域非常重要，SMOKE是2021年CVPR workshop的文章，精度在kitti上排名前列（当然是和单目的其它算法横向对比），且代码开源，最近也被baidu apollo7.0集成到了感知模块，非常值得学习！paper: https://openaccess.thecvf.com/content_CVPRW_2020/html/w60/Liu_SMOKE_Single-Stage_Monocular_3D_Object_Detection_via_Keypoint_E
复制链接

扫一扫

专栏目录

chaoqinyou CSDN认证博客专家 CSDN认证企业博客

码龄13年

42: 原创

12万+: 周排名

12万+: 总排名

4万+: 访问

: 等级

449: 积分

32: 粉丝

23: 获赞

13: 评论

141: 收藏

私信

关注

热门文章

分类专栏

最新评论

(2022 IV) RCBEV
sangba2019: 博主，你好。我看你分享的论文多是radar-camera feature级的融合，请问博主对前融合有研究么
stable diffusion webui 搭建和初步使用
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/618243930。
论文阅读笔记：(2021.10 CoRL) DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D Queries
K Ronaldo: 博主您好，关于这个论文我看了非常久，有一个问题一直弄不明白。就是他们的速度预测是怎么实现的呢？他们似乎完全没有用到时序信息
(2022.05) BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird‘s-Eye View Representation
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
(2019.01, iclr) Decoupled Weight Decay Regularization
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。