2022《OpenScene: 3D Scene Understanding with Open Vocabularies》阅读笔记2

初篱

于 2024-02-28 11:17:45 发布

阅读量275

点赞数

分类专栏：视觉语言导航VLN 文章标签：笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44100524/article/details/136340113

版权

视觉语言导航VLN 专栏收录该内容

26 篇文章 ¥19.90 ¥99.00

订阅专栏

本文详细介绍了OpenScene的实现细节，包括3D蒸馏、特征融合和MSeg投票策略。在3D蒸馏中，使用PyTorch、Adam优化器和MinkowskiNet进行训练。特征融合考虑了不同数据集的特性，如深度图和激光雷达点的处理。MSeg投票用于多视图预测，简单提示工程提高了LSeg性能。此外，分析了模型在不同标签集间转移的能力以及多视图融合策略的效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

A. Implementation Details

3D Distillation.

我们基于PyTorch实现。为了提取 $\varepsilon ^{3D}$ ，我们使用Adam[26]作为优化器，初始学习率为1e−4，并训练100个epochs。对于MinkowskiNet，我们对ScanNet和Matterport3D实验使用2cm的体素大小，对nuScenes使用5cm的体素尺寸。对于室内数据集，我们将场景的所有点输入到3D主干以具有完整的上下文，但对于蒸馏损失（Eq.2），由于内存限制，在本文中，我们在每次迭代时仅使用20K均匀采样的点特征进行监督。对于nuScenes，我们输入半秒片段内的所有激光雷达点，并且仅使用最后一个时间戳处的点特征进行训练。我们为ScanNet和Matterport3D使用了一个batch size为8的NVIDIA A100（40G）。对于nuScenes，我们使用16的batch size和4个A100 GPU。训练大约需要24小时，推理需要0.1秒。此外，对于所有数据集，我们在蒸馏过程中只将3D点位置作为MinkowskiNet的输入。

了解本专栏

博客等级

码龄6年

35
原创

157
点赞

186
收藏

291
粉丝

关注

私信

热门文章

分类专栏

最新评论

代码复现3—VLN-CE
初篱: 检查一下内存显存是否充足，或者重新创建环境
代码复现3—VLN-CE
heathCl1iff: 请问在训练seq2seq基线的时候，每次到6%就会出现一个raise EOFError的报错，是为什么？报错如下： Traceback (most recent call last): File "/home/heath/vln/habitat-lab/habitat/core/vector_env.py", line 588, in __del__ self.close() File "/home/heath/vln/habitat-lab/habitat/core/vector_env.py", line 456, in close read_fn() File "/home/heath/vln/habitat-lab/habitat/core/vector_env.py", line 97, in __call__ res = self.read_fn() File "/home/heath/vln/habitat-lab/habitat/utils/pickle5_multiprocessing.py", line 68, in recv buf = self.recv_bytes() File "/root/anaconda3/envs/vlnce/lib/python3.7/multiprocessing/connection.py", line 216, in recv_bytes buf = self._recv_bytes(maxlength) File "/root/anaconda3/envs/vlnce/lib/python3.7/multiprocessing/connection.py", line 407, in _recv_bytes buf = self._recv(4) File "/root/anaconda3/envs/vlnce/lib/python3.7/multiprocessing/connection.py", line 383, in _recv raise EOFError EOFError:
代码复现3—VLN-CE
啊呜啊呜+: 请问我在evals的时候一直重复下载Created DrawableGroup是为什么呢
代码复现1——Matterport3d数据集下载
初篱: 你可以直接查看文章中链接
代码复现1——Matterport3d数据集下载
xujiayueyueyuye: 你好，请问必须是用老师的邮箱发吗？他问我确定PI是你的指导教授吗，我回完之后他就不回了

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

初篱 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。