论文阅读 DyCo3D: Robust Instance Segmentation of 3D Point Clouds through Dynamic Convolution

一路繁华的^夏

于 2023-04-04 10:25:18 发布

阅读量286

点赞数 3

分类专栏：论文阅读文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/canmengw/article/details/129946888

版权

论文阅读专栏收录该内容

4 篇文章 1 订阅

订阅专栏

DyCo3D提出了一种新的数据驱动方法，使用动态卷积针对实例特性生成卷积核。它通过探索同质点的上下文和质心信息，避免了对提议的依赖，提高了稳定性和泛化能力。利用轻量级transformer扩大感受野，但计算量大和有限的感受野仍是挑战。解码器通过实例感知权重生成进行实例分割，损失函数结合了语义分割、质心监督和实例分割的多个方面。消融实验展示了不同搜索半径对性能的影响。

摘要由CSDN通过智能技术生成

DyCo3D

提出了一种动态的、无建议的、数据驱动的方法，该方法生成适当的卷积核，以响应实例的性质

通过收集共享相同语义类别并对几何质心有密切投票权的同质点来探索大的上下文。然后通过几个简单的卷积层对实例进行解码。

基于聚类的方式通过收集合并相同类别标签来生成实例建议，但是对超参数比较敏感，以及复杂的后续处理步骤影响泛化能力和鲁棒性。

主要贡献创新：

1，动态卷积进行三维实例分割

2，无提议方法具有更强的稳定性

3，轻量级transformer来扩大感受野

结构组件：

1，稀疏卷积主干，输出三个分支，掩码分支，偏移预测分支以及语义分支

2，将质心预测以及语义分割作为输入的权重生成，对质心共享类别预测的同质点来输出实例感知位置嵌入特定类别掩码和卷积。

3，解码器，通过卷积进行解码，滤波器由权重生成构建。

其中动态卷积具有一定局限：

1，大量计算导致优化困难。

2，由于稀疏卷积，性能会受到有限的感受野限制。

因此需要进行改进应用在三维实例分割上。

Centroid Offset

其中质心偏移遵循VoteNet将点移动到实例相应质心，逐点预测，损失函数如下

Pi是第i个点坐标，Ooff是第I项，ctr是相应实例几何质心，pi为指示函数。

Dynamic Weight Generator

建议对几何质心具有接近投票权并共享类别预测的同质点进行分组。然后，通过应用小型子网络进行大型上下文聚合，动态生成实例感知过滤器。

与传统方法不同，传统方法直接将聚类视为单独的实例提议，会严重对提议质量产生依赖，这里通过探索点空间分布并集成上下文来生成用于实例解码的过滤器。

如果满足以下条件，点 pj 可以与 pi 分组：(1) ljseg = liseg。 (2)‖pjctr − pictr‖2 <= r，其中 r 是预定义的搜索半径。由于每个聚类仅考虑一个特定类别，因此可以轻松从语义预测中获取聚类 Cz 的语义标签 lzC ∈ R。我们还将聚类 Cz 的几何质心标记为 Czctr ∈ R3，该几何质心计算为 Cz 中点的坐标的平均值。每个聚类包含一组分布在实例中的点，引入了大量上下文和丰富的几何信息。探索这些聚类并生成针对每个实例的特征来生成实例感知权重。

Instance Decoder

直接在特征空间中附加位置嵌入，对于几何质心的第z个实例，第i个点f的pos位置嵌入计算如下：

对于输入特征由pos以及mask来生成，整个解码器包含三个卷积层，内核大小为1*1，每一层都是用ReLU作为激活函数，假设mask的特征维度为8，意味着D=8，则Wc的参数总数，包含权重和偏差为177，计算如下：

其中实例分割的损失函数定义为：

总损失为：

其中Lseg为语义分割，Lctr为质心监督，Lmask和Ldice是实例分割的两个损失向，权重都设置为1.0，推理过程中采用对实例二进制掩码进行NMS，IoU阈值为0.3。

消融实验

不同半径r对实例分割性能研究

在scannetV2验证集上mAP值

一路繁华的^夏

关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
论文阅读 DyCo3D: Robust Instance Segmentation of 3D Point Clouds through Dynamic Convolution

其中Lseg为语义分割，Lctr为质心监督，Lmask和Ldice是实例分割的两个损失向，权重都设置为1.0，推理过程中采用对实例二进制掩码进行NMS，IoU阈值为0.3。与传统方法不同，传统方法直接将聚类视为单独的实例提议，会严重对提议质量产生依赖，这里通过探索点空间分布并集成上下文来生成用于实例解码的过滤器。2，将质心预测以及语义分割作为输入的权重生成，对质心共享类别预测的同质点来输出实例感知位置嵌入特定类别掩码和卷积。Pi是第i个点坐标，Ooff是第I项，ctr是相应实例几何质心，pi为指示函数。
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。