【点云系列】PointContrast：Unsupervised Pre-training for 3D point cloud understanding

最新推荐文章于 2023-07-19 10:18:45 发布

^_^ 晅菲

最新推荐文章于 2023-07-19 10:18:45 发布

阅读量1.3k

点赞数 5

分类专栏：点云类文章标签：计算机视觉神经网络

本文链接：https://blog.csdn.net/weixin_43882112/article/details/108518931

版权

PointContrast是针对3D点云理解的无监督预训练方法，通过对比学习和稀疏残差U-Net改进特征提取。实验表明，这种方法在ShapeNet、S3DIS等数据集上的分割和检测任务中提升了性能。

摘要由CSDN通过智能技术生成

1. 概要

题目：PointContrast: Unsupervised Pre-training for 3D Point Cloud Understanding
论文：https://arxiv.org/abs/2007.10985
代码：暂未公布

迁移学习，在图像领域，先用模型在一个比较大的的数据集（例如ImaegNet）做预训练，然后用预训练好的参数作为模型初始值，在特定任务的小数据集上训练，有助于提升性能。

这个经验，本质上相当于用大的数据集，先训练出来一个“比较好的、通用一点的”的特征提取器，然后在小数据集上对特征提取器进行微调修正让其能在小数据集上表现的更好。

但是在3D点云理解还所知甚少。因此，是否其在3D点云理解当中也一样有效？也即想要在3D表达学习当中尝试看，一个预训练的非监督学习在微调的监督度学习智商，是否有助于提升性能。

目的：通过在深度学习中对在有监督的微调之上的无监督的预训练进行研究，推动对3D场景理解的研究。因此需要4个重要元素：

选择可以预训练的大规模数据集；
—>ScanNet
识别骨架结构，可以被许多不同的任务来共享；
—> 稀疏残差 U-Net
评估骨干网络预训练的两个无监督指标；
—> Hardest-contrastive loss + PointInfoNCE loss
定义对一组不同小型/子数据集和任务的评估协议。-
–>语义分割：S3DIS，ScanNetV2，ShapeNetPart，Synthia 4D
–>目标检测： SUN RGB-D， ScanNetV2

主体依赖于全卷积几何特征（FCGF），以及无监督学习3D表达的思想，
在此基础上重新设计并提出来PointInfoNCE Loss + U-net 框架

在这里插入图片描述

从上图似乎可以发现，shapenet预训练对于downstream没有帮助，可能原因有两点：

原域和目标域差距：由于ShapeNet中的物体是合成的，在尺度上归一化过，动作都是校准后的，缺乏场景上下文。这使得预训练和精细调参后的数据分布明显不同；
点级别的表示：在3D深度学习中，局部集合特征，例如局部点和其临近点都对3D类任务非常有效。但直接在目标实例上获取全局特征可能还是不够的；

问题1可以通过改用scannet数据集来得到解决；
问题2呢？即PointContrast

对于FCGF[10]，其用来学习低层任务（例如：校准）的几何特征。
其有两个关键元素实现好结果：

高层级策略：对比学习-点级别的-在两个转换的点云中。
如图所示，

在ScanNet的某个场景中，通过两个不同的视角 $x^1$ 和 $x^2$ ，坐标对齐，然后计算两者对应映射 $M$ , 如果 $(i,j)\in M$ , 则 $x^1_i$

关注

专栏目录