新增了近百场顶会论文讲解,涉及SLAM/三维重建/位姿估计/具身智能/自动驾驶等方向...

今天有粉丝问:

加入「3D视觉从入门到精通」知识星球,可以学习最新顶会论文或最新前沿技术吗?有最新顶会论文作者讲解吗?

借此机会,在这里给大家盘点一下星球内部近期新增的顶会论文讲解,因篇幅有限,仅作部分展示。

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

c92996665c1a38b5bc12aedfdd696a51.png

扫码加入学习,圈里有高质量教程资料、可答疑解惑、助你高效解决问题
39e54d6ec752581ae5d65a4e791f7b93.png

1、CVPR2024满分论文!即插即用的6D物体姿态估计大模型 FoundationPose ( BOP排行榜第一名算法)

大纲

  1. 6D物体姿态问题回溯

  2. 相关论文和SOTA方法简介

  3. 目前领先算法FoundationPose论文讲解

  4. 代码和用法讲解

76f744cb87b757d2d89b4d234dca23c1.png

2、CVPR'24 开源|NeRF-SLAM新SOTA:请任意选择你的高效神经表征和渲染方程!

大纲

  1. NeRF 在 SLAM 问题中的应用回顾

  2. 相关论文简介

  3. NeRF 到底是如何影响SLAM的表现的:一个统一分析框架

  4. 代码简介

3bc599ac51e478ab5657f5514df11f1a.png

3、中科院最新CityGaussian:VR/AR时代的城市重建新标杆

大纲

  1. 三维重建问题与算法回顾

  2. 大场景重建相关论文和SOTA方法简介

  3. 目前领先算法CityGaussian论文讲解

0608ef5934c36d8fc16435ef6bef24d5.png

4、CVPR'24 | XScale-NVS: 基于哈希特征流形的大场景跨尺度高分辨神经渲染SOTA

大纲

  1. 神经渲染现有方法简介

  2. XScale-NVS论文详解

  3. 代码、数据用法讲解

08357c4dc6e94f5d356133d68f066eb3.png

5、DistGrid:基于分布式神经辐射场阵列的大规模场景重建

大纲

  1. 大规模场景渲染现有方法简介

  2. DistGrid论文详解

3f512d01a517d47e6060ffc2b23d0d8a.png

6、CVPR'24 | I'M HOI:拥抱多模态!融合视觉惯性感知,精准捕捉人物交互!

大纲

  1. 动作捕捉与人物交互研究背景

  2. I'M HOI研究动机

  3. I'M HOI论文算法详解

  4. I'M HOI论文数据详解

f4f115e394905e2aa9a805d3e8b1a5d1.png

7、ICLR'24 开源 | DiffTF:首个基于3D感知Transformer的3D物体生成最新SOTA!

大纲

  1. 3D物体生成现有方法简介

  2. DiffTF论文详解

  3. 实验细节、代码、数据用法讲解

01396f1fec8b67f53e5a4652ef2d9769.png

8、CVPR'24 | KTPFormer: 3D人体姿态估计SOTA! 在Transformer下即插即用涨点!

大纲

  1. 3D人体姿态估计现有方法简介

  2. CVPR2024论文KTPFormer详解

7cca5c77a0b250fc799ff8a9a8a388d8.png

9、ICML'24开源 | LEO:首个三维世界中的具身通用智能体

大纲

  1. 研究背景与动机

  2. 具身通用智能体: LEO

  3. 三维指令微调数据集: LEO-align & LEO-instruct

  4. 实验结果与demo展示

89b351a9363144456f69c412c8b90b94.png

10、TTIC最新提出 | 性能达到了98.4%!Transcrib3D:基于大语言模型三维指称表达理解SOTA

大纲

  1. 三维指称表达理解的问题与现行方法

  2. Transcrib3D方法介绍

4074f06e8849ca6d6129c0a4ea749908.png
学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

e6da0dc1e66a5c9e1781a3ec35e5f0f3.png

扫码加入学习,圈里有高质量教程资料、可答疑解惑、助你高效解决问题

11、清华最新!无人机飞行速度建模 | Localization matters too: 定位误差如何影响无人机飞行速度

大纲

  1. 无人机建模现有方法简介与意义

  2. Localization matters too 论文详解

  3. 清华大学电子系空地协同云测试场

3c67f6befd055231a44af4c3991a9d04.png

12、CVPR'24 Hightlight | GP-NeRF: 基于上下文感知的通用语义NeRF!

大纲

  1. 语义神经渲染现有方法简介

  2. GP-NeRF论文讲解

  3. 未来展望

196bfc95076a6a8aa6250ba9aa04daa5.png

13、当MVS遇上Gaussian | MVSGaussian: 快速、可泛化的高斯重建框架!

大纲

  1. 可泛化的新视图合成方法回顾

  2. MVSGaussian论文详解

75247f8c4d3016679e87f30fa4c8af77.png

14、CVPR'24 Oral | Waymo新SOTA!纯稀疏检测器SAFDNet的前世今生!

大纲

  1. 相关工作回顾

  2. HEDNet方法介绍

  3. SAFDNet方法介绍

  4. 实验结果

  5. 交流讨论

dd87641b51fd4f06cfd38c5655738f50.png

15、SIGGRAPH'2024 | RTG-SLAM:基于3DGS的大尺度场景实时三维重建

大纲

  1. RGB-D SLAM现有方法回顾

  2. RTG-SLAM论文详解

  3. 后续研究方向的讨论

2fb6fe0f2f592dee79bd50e521c4115b.png

16、大场景重建最新SOTA | DoGaussian:分布式训练3DGS,训练速度提升6倍以上,实现高质量渲染

大纲

  1. 大规模重建现有方法简介

  2. DoGaussian论文详解

  3. 未来工作、展望

  4. 讨论交流

6478c797a96b45790899c05c8b649f41.png

17、港科大最新 | 3D目标检测新SOTA,APNovel提升140%

大纲

  1. NeurIPS2023工作CoDA详解

  2. 最新拓展工作CoDAv2详解

  3. 代码、数据用法简介

  4. 论交流

28b2a997448f15d678aa632e4bc53551.png

18、重磅开源SA-GS:重新定位最新大场景3D重建SOTA!

大纲

  1. 几何重建的问题描述和好用的dataset

  2. 以几何重建为核心的算法回顾和常见问题以SuGaR和2DGS为例

  3. 为什么语义信息能够帮助几何重建,SA-GS 算法简介

  4. 未来几何重建有什么挑战,还有什么方向值得深挖

82311863713adb7623937b4a13affc8d.png

19、CVPR'24 | Symphonies:基于实例级建模的3D场景占用预测新SOTA

大纲

  1. 3D 语义场景补全/场景占用预测现有方法简介

  2. Symphonies 论文详解

  3. 讨论交流

e7f66530b49d51e5d0cc98a92cd58039.png

20、CVPR'24 开源| OMG-Seg: Beyond SAM,一种统一的图像,视频,开集,交互式的分割模型

大纲

  1. 现有的主流分割技术回顾,包括SAM以及open-set、video segmentation等

  2. 我们的OMG-Seg的技术细节

  3. 实验结果展示和分析

  4. OMG-Seg的应用扩展:OMG-LLaVA

  5. 未来工作讨论

3f04430921fcf9bb0ab5a79319854a99.png
学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

24e777b7873cc2b145da6e1c6292a8d2.png

扫码加入学习,圈里有高质量教程资料、可答疑解惑、助你高效解决问题

21、自驾场景 快速训练!CarDreamer:首个开源世界模型自动驾驶平台

大纲

  1. 现有的基于World Model的强化学习介绍

  2. CarDreamer平台介绍

  3. 成果展示,代码用法、平台结构介绍

  4. 未来工作讨论

2d7a93fbb2f5a04ac23021be9273f4a0.png

22、上汽零束 | NeRO: 基于隐式神经网络的道路重建

大纲

  1. 道路重建现有方法简介

  2. NeRO论文详解

7e41e6447068c3aee57ede6f457f180a.png

23、Co-driver: 用多模态大模型辅助场景理解和驾驶风格的自动驾驶助手

大纲

  1. 当前的一些以大模型为基础的端到端解决法案

  2. 用于多模态大模型微调的数据集采集

  3. 在Carla中连接多模态大模型进行仿真实验

83a27f6122258b658efa603655d49a4e.png

24、卡内基梅隆大学 | DarkGS: 移动光源3DGS!从泰坦尼克号这一幕说起

大纲

  1. 3D Gaussian Splatting与相关背景

  2. DarkGS论文解读

  3. 代码讲解

  4. 未来方向展望与讨论

c8b19f208153d223f025e3cc5c0f3919.png

25、上交开源 | 再现物理世界的通路:由三维重建到物理仿真

大纲

  1. 自动驾驶场景的高效三维重建

  2. 基于视觉物理的动力学推断与物理真实的动态生成

a34f96c2e5d74e7b0ac807e93f9b12bc.png

26、Adobe Research | 零样本3D重建:无需真实数据也能生成逼真3D模型

大纲

  1. Large Reconstruction Model (LRM) 简介

  2. LRM-Zero论文详解

ca160eafe98ebbbb5e1de9c301e3cc6b.png

27、CVPR 2024 Highlight!三维生成4.5k星开源项目 | Wonder3D单张图片变高质量三维

大纲

  1. 三维生成现有方法简介

  2. Wonder3D论文详解

  3. 代码、数据用法讲解

cb047e572d244490d83e68bf620b6db0.png

28、大模型时代下的端到端自动驾驶

大纲

  1. 如何实现自动驾驶大模型

  2. 纯视觉自动驾驶的发展脉络

  3. 以物体为中心的三维场景表示(GaussianFormer、SpatialFormer, ECCV 2024)

  4. 基于世界模型的端到端自动驾驶(GenAD、OccWorld, ECCV 2024)

d79b599ba8ca02e37ff8e09e7ba07b1f.png

29、首次解锁CARLA V2全场景!基于隐世界模型的高效强化学习自驾模型

大纲

  1. CARLA V2闭环仿真评测基准简介

  2. 基于隐世界模型的强化学习方案简介

  3. 自驾规控问题特点及方案应用剖析

  4. 端到端评测生态思考

95287193c2364052e360c0dac589000e.png
学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

44cf603fdcf4abe3a0e5fd5681d45f44.png

扫码加入学习,圈里有高质量教程资料、可答疑解惑、助你高效解决问题

30、CVPR'24&ECCV'24 | 上下文模型如何将3D表征压缩近百倍!3D表征压缩技术的新SOTA!

大纲

  1. 探索上下文模型对NeRF压缩的设计

  2. 探索上下文模型对3DGS压缩的设计

  3. 分别介绍相关背景及技术实现

  4. 性能展示

4ae05e52cca366265a1729b1d0dea8f6.png

31、CVPR'24开源 | 吊打一切VINS!又快又好的视觉惯性导航系统!

大纲

  1. Introduction

  2. Motivation

  3. Methodology

  4. Experiments

  5. Conclusion

  6. Further Work

9194d89a9637746ce1c9d5a09e943dc5.png

32、英伟达 | OmniDrive: 基于稀疏查询的三维自驾VLM框架

大纲

  1. 基于稀疏查询的3D自动驾驶系统

  2. 自动驾驶3D多模态数据集

  3. 自动驾驶3D多模态模型

c28c60e34895b9e1e8071596043afac8.png

33、Co-Occ: 显式特征融合与体渲染联合优化多模态三维语义占用预测方法

大纲

  1. 多模态3D语义占用问题回溯

  2. 相关论文和SOTA方法简介

  3. Co-Occ论文讲解

7e01a989395d348708bd727974af56dd.png

34、MM-Gaussian: 多模态室外3DGS SLAM

大纲

  1. Introduction

  2. Pipeline

  3. Relocalization

  4. Experiments

  5. Conclusion

f18fd7e3d610f8d68bfc8669564f12fd.png

35、CVPR'24 Highlight 开源 |DyNFL:使用NeRF对动态激光雷达场景仿真

大纲

  1. ntro

  2. Related Work

  3. Methods

  4. Results

  5. Conclusion

4628d9c23ac8360726ef44515e1aa949.png

36、ICML'24开源 | AVTrack:最强实时无人机跟踪算法!

大纲

  1. Introduction

  2. Motivation

  3. Methodology

  4. Experiments

  5. Conclusion

c52ecb5611d87d45110d6d8c382d3fa5.png

37、浙大章国锋团队最新开源NIS-SLAM:突破神经隐式语义RGB-D SLAM的极限


大纲

  1. 个人与实验室简介

  2. 语义SLAM与隐式SLAM回顾

  3. 基于神经隐式表达的3D一致语义SLAM

  4. 讨论交流

aabb822c55a17434e230b2e8586dca13.png

38、首个Linear RNN-based通用3D检测框架LION,全部SOTA!

大纲

  1. 主流3D检测框架

  2. 基于Linear RNN-based的三维目标检测(LION, Arxiv 2024)

  3. 基于DETR方式的三维目标检测(SEED, ECCV 2024)

  4. 未来与展望

ad3d48f59fa967bfbe211aed2f6e82d6.png

39、CVPR'24开源 | 基于可驱动3D高斯的单目人体数字化身建模

大纲

  1. 个人简介

  2. 任务背景

  3. 基于可驱动3D高斯的单目人体数字化身建模方法

  4. 讨论交流

374d15aa2b938a30d41a1655561613bd.png

40、ECCV'24 Oral开源高赞 | 无需优化,MVSplat两张图实现高质量3DGS重建

大纲

  1. 前馈高斯泼贱(Feed-forward 3DGS)背景介绍

  2. MVSplat 研究动机及贡献

  3. MVSplat 网络框架及训练

  4. MVSplat 效果和性能展示

  5. 总结和展望

f1d2b14c8b0398468d15305eb97fb6df.png

星球会员权益

  • 项目、学习、求职中遇到的问题,免费获得解答

  • 免费学习星球视频课程。

  • 星球每月之星会给予丰厚的现金奖励

  • 优先承接来星球内部项目对接。

  • 星球内不定期分享最新顶会论文作者讲解

  • 官网课程:www.3dcver.com,星球有效期内的成员均可享原价的八五折特惠

  • 免费学习星球内分享的最新论文解读和代码

  • 优先获得3D视觉企业(与工坊深度合作企业)内推资格

  • 可在星球内快速找到志同道合的学习伙伴,不再单打独斗,抱团取暖,走得更快更远。

  • 不定期星球内部会组织项目实训,包括相机标定、机械臂抓取、三维重建、g2o优化等

加入知识星球

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

e1a694149a90fccf230a84bfda4af333.png

扫码加入学习,圈里有高质量教程资料、可答疑解惑、助你高效解决问题
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值