代码大全pdf_首个实时单目3D目标检测算法:RTM3D,代码将开源

点击上方“计算机视觉life”,选择“星标”

快速获得最新干货

基于单目图像的3D目标检测是在输入RGB图像的情况下估计目标的3D包围框,在自动驾驶领域非常有用。

356ff1da4944a95c1370761f5c0a0788.png

今天来自中科院沈阳自动化所等单位的学者公布论文提出一种实时的单目3D目标检测算法RTM3D,快速版30fps,并且代码将开源。

以下是作者信息:

950c2649e28ef6c81b66a0c3edd064aa.png

RTM3D算法的主要思路,如图:

23df72485155a22bc016b6c89b314186.png

输入RGB图像,经过深度神经网络,预测目标的9个空间点(1个中心点,8个顶点),使用几何限制估计更加精确的9个空间点,进而找到目标的3D包围框。

下表为该文算法与其他3D目标检测方法比较,RTM3D不需要其他外部数据,而且速度达到实时。

e51696ab16ef5070fc98b5583a914b46.png

算法架构图:

74e9fa59aa22c3c5cea0c250901e8d5f.png

00390688fd2e2d0102c1a47c1d1b8c05.png

实验结果

在KITTI数据集上的实验结果,该算法在精度达到SOTA的同时,是目前少数达到实时的3D目标检测算法。

56a28813f1d3c8798713e919c76501b7.png

b8f65d9786db7371290fc014cc62a837.png

c85658f9fae926576db1c5d9720e80c6.png

检测结果示例:

95b8788ce41c9ba89f2cf60c3b250511.png

论文地址:

https://arxiv.xilesou.top/pdf/2001.03343.pdf

代码地址:

https://github.com/Banconxuan/RTM3D

目前代码还未放出,期待早日开源。

交流群

欢迎加入公众号读者群一起和同行交流,目前覆盖SLAM、三维视觉、传感器自动驾驶、计算摄影、检测、分割、识别、Re-id、强化学习、模型压缩剪枝、医学影像、GAN算法竞赛等微信群,请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

326d0fb635d86cf5fcfc3b31e5f3fafa.png

投稿、合作也欢迎联系:simiter@126.com

8df76d8d40c62dd5e99e5c96e285a232.png

长按关注计算机视觉life

推荐阅读

现在开源的RGB-D SLAM有哪些?

详解 | SLAM回环检测问题

汇总 | SLAM、重建、语义相关数据集大全

吐血整理 | SLAM方向国内有哪些优秀的公司?

最强战队 | 三维视觉、SLAM方向全球顶尖实验室汇总

SLAM方向公众号、知乎、博客上有哪些大V可以关注?

汇总 | 最全 SLAM 开源数据集

综述 | SLAM回环检测方法

干货总结 | SLAM 面试常见问题及参考解答 2019 最新SLAM、定位、建图求职分享,看完感觉自己就是小菜鸡! 2019暑期计算机视觉实习应聘总结

2018年SLAM、三维视觉方向求职经验分享

经验分享 | SLAM、3D vision笔试面试问题

最新AI干货,我在看  5405fe531053ff7a9729aa3d644071d8.gif

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值