基于Transformer的端到端跨模态3D目标检测器!易上手

ICCV'23旷视科技创新工作Cross Modal Transformer(CMT)提出了——跨模态的Transformer将图像和点云数据作为输入,并且直接生成精确的3D检测框。在nuScenes test数据集上达到了74.1%的NDS(单一模型的最先进技术),同时保持了快速的推理速度。即使缺少 LiDAR,CMT也具有很强的鲁棒性。此外,整个跨模态的Transformer设计非常简单,主要是它易于复现。

cfaa26e9a99ac4c4a0fe2de855681ed4.jpeg

为了让大家更好的掌握跨模态3D目标检测器,并改进融合运用到自己的论文中,研梦非凡于10月31日晚(周四),邀请了来自QStop50学校博士—杨导师,为大家独家详解《超实用发论文方向!基于Transformer的3D 目标检测》,从跨模态Transformer的性能与贡献到3D目标检测、重点讲解跨模态Transformer的算法研究以及实验,一文速通跨模态3D目标检测,复现论文,找创新点,轻松发论文!

👇🏻扫描二维码找助教0元预约直播课!

44df37b269513c1336d5ea9b4ec066d1.png
凡预约即可免费领取200篇前沿论文(目标检测+大模型+多模态)

6f48d3c62eab0563ff900b4cb6c192e7.png

45600703e8941862641efe83dc32c45f.gif

直播课内容预览

ICCV'23《Cross Modal Transformer: Towards Fast and Robust 3D Object Detection 》

一、论文摘要

  1. CMT模型

  2. 无需显式视图转换

  3. 设计简洁易复现

  4. 多模态tokens的空间对齐

  5. 快推理速度,高准确率

二、研究背景

  1. 跨模态介绍

  2. 跨模态Transformer与SOTA性能的比较

  3. 跨模态Transformer的主要贡献

三、相关工作

  1. 基于相机的3D目标检测

  2. 基于LiDAR的3D目标检测

  3. 多模态的3D目标检测

  4. 基于Transformer的目标检测

👇🏻扫描二维码找助教0元预约直播课!

b45fbb0f2d5ed931de581e23cf175691.png
凡预约即可免费领取200篇前沿论文(目标检测+大模型+多模态)

四、算法研究

  1. 跨模态Transformer的结构

  • 跨模态变换器(CMT)架构

  • CMT通过建立不同模态间的位置对应关系

  1. 坐标编码模块(CEM)

  2. 图像的CE

  3. 点云的CE

  4. 位置引导的查询生成器

  5. 解码器和损失函数

  6. 基于Mask的训练和模型鲁棒性研究

  7. 讨论

  • CMT与FUTR3D在端到端建模动机上类似,但方法和效果完全不同

  • 主要区别


五、实验结果

  1. 数据集和评估指标

  2. 实验细节

  3. 与最先进技术的比较

  4. 强大的鲁棒性

  5. 消融研究

  6. 分析

六、总结和展望

  1. 跨模态的Transformer

  2. 强大的性能且易于复现

👇🏻扫描二维码找助教0元预约直播课!

15069465a83e2f584add5f665bc04a95.png
凡预约即可免费领取200篇前沿论文(目标检测+大模型+多模态)

6bee61f5e16c17f0a6ce8325dd52fa28.png

82e6caf50ad94564805c6fb1093fe83a.gif

直播导师介绍

杨导师

杨导师,博士毕业于QStop50知名计算机名校。

博士期间研究方向:聚焦为计算机视觉,自然语言处理,高效的深度学习训练和推理方法,大语言模型轻量化与高效微调技术。

曾在多家公司担任算法研究员,并进行计算机视觉,高效模型压缩算法,多模态大语言模型的研究,包括模型量化,剪枝,蒸馏,编译以及高效稀疏化训练与推理。

在国际顶级会议CVPR,ICCV,EMNLP等发表13篇论文,并担任CVPR,ICCV,ECCV,ICML,ICLR,NeurIPS等重要会议和期刊的审稿人。

多项发明专利,指导学生有耐心,教学严谨,思维逻辑缜密,已经指导数十篇论文。

对于成果好的学生,帮助学生写推荐信和指导申请硕/博申请。

👇🏻扫描二维码找助教0元预约直播课!

e3e90e2aa774cdf8d846c1396ba7798c.png ps:研梦非凡开设的前沿论文系列直播,旨在帮助大家提升读论文技能,快速抓住重点,掌握有效方法,进而找到创新点,轻松产出科研论文成果。

研梦非凡科研论文指导

科研论文idea,并非拍脑门就能产生,需要经过一遍遍做实验、跑代码、改模型、思路修正。研梦非凡专业论文指导,和研梦导师一起找idea,共同解决科研问题。授之以渔——搭建论文写作框架,增删改查,针对性实验指导!哪里薄弱补哪里!

0b97d3f2f2c4750c3e23c40174a1f2c6.jpegf54971c3422d6072d547792da14b1a29.jpeg

<<< 左右滑动见更多 >>>

可辅导的自动驾驶方向

65418baa3af39990e21593f1c810f730.jpeg8406c1e0a63fababa34a662d740ec75d.jpegb5915c1c7ccb96bfca8bf8dea6a5287d.jpeg

<<< 左右滑动见更多 >>>

6d4b5ac69551dd2085c83edb815b9124.png

扫码预约研梦非凡同方向导师1v1 meeting

研梦非凡部分导师介绍

研梦非凡导师团队,来自海外QStop200、国内华五、C9、985高校的教授/博士导师/博士后,以及世界500强公司算法工程师、国内外知名人工智能实验室研究员等

这是一支实力强大的高学历导师团队,在计算机科学、机器学习、深度学习等领域,积累了丰富的科研经历,研究成果也发表在国际各大顶级会议和期刊上,在指导学员的过程中,全程秉持初心,坚持手把手个性化带教。包括但不限于以下导师~

6dba86942a73c69e8a09cac89630a9ce.jpeg5397ff599b266c5c22e92d669674a845.jpege254bc29653f1c8ade2ab9e12a46f8a1.jpegc12021772b4635bf4c2edb95125b0a5c.jpeg6bd5d757055602db2a170c5785ff10bf.jpeg47d7cd41d0962138342c2a5ad0f50a3b.jpegb9bfa9aafb2bcd48a3cbfce4c57e88ba.jpegf69ef5eeac76fb0b1a90025f22cc1299.jpeg

<<< 左右滑动见更多 >>>

951b508f90004a0817cb6981ebfcef85.png

扫码预约研梦非凡1v1导师meeting

比赛8人冲牌小班介绍(第一二期已满,三期开招)

6bd40787749a3e4510455345d25e86ac.jpeg7f1384aab54e51b0bc9c2314547559fe.jpeg

<<< 左右滑动见更多 >>>

我们不是小作坊哦~我们背靠研途考研(就是张雪峰老师和徐涛老师在的那个研途考研),做教育十余年,重交付,重口碑,是我们一贯的公司理念!

c1ce527bedf1e37ac8e661d17ea89bf6.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值