论文解读：SAM3D: Segment Anything in 3D Scenes

最新推荐文章于 2025-04-09 09:17:46 发布

pontoon

最新推荐文章于 2025-04-09 09:17:46 发布

阅读量810

点赞数 6

分类专栏：论文解读文章标签：人工智能计算机视觉论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pontoon/article/details/141608034

版权

论文解读专栏收录该内容

7 篇文章

订阅专栏

SAM3D: Segment Anything in 3D Scenes

- 方法流程
- bottom-up方法

方法流程

1.利用SAM在RGB上的Mask，分割点云。
2.数据是有相机姿态的 RGB 图像以及对应3D点云，首先使用 SAM 预测 RGB 图像的Mask，然后将 2D Mask投影到 3D 点云中，之后迭代地合并3D Mask。
3.在每一次迭代，使用bidirectional merging方法合并两个相邻帧的点云Mask，从不同帧预测的3DMask逐渐合并到整个3D场景。
bidirectional merging方法：1.计算两帧点云之间的mapping；2.第一帧点云中的object mask（mask id为m）map到第二帧点云中的object mask（mask id为n），σmn为第二针点云中object mask id为n的点数量，σm为第一帧点云中maskid为m的点数量，σn为第一帧点云中maskid为n的点数量，满足下式则认为高度重叠，可合并成一个mask，其中阈值0.5
在这里插入图片描述

可理解为两帧点云被映射到的部分取IOU，IOU大于0.5即认为重叠
之后将第二帧点云中id为m的mask改为id为n
之后再将第一帧和第二帧点云调换过来重复上述步骤，将第一帧点云中id为n的mask改为id为m

bottom-up方法

假设有K帧点云
[图片]

将
[图片]

合并成
[图片]

合并的方法用bidirectional merging方法，以此类推，直至合并成一个最后的点云。类似于归并排序的思想，合并log2n次
[图片]

4.optional:将 SAM3D 的结果与基于 3D 场景的几何信息的过分割结果进行集成。
用scnaet中的mesh 图割结果和SAM3D 的结果合并
[图片]

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。