浅读CVPR2022-CrossPoint

最新推荐文章于 2024-03-24 14:59:04 发布

一个普通的求学者

最新推荐文章于 2024-03-24 14:59:04 发布

阅读量1.1k

点赞数 7

文章标签：计算机视觉人工智能

本文链接：https://blog.csdn.net/m0_55038143/article/details/123530554

版权

本文介绍了CrossPoint，一种用于3D点云自监督学习的跨模态对比学习方法。通过对比2D图像和3D点云的特征，CrossPoint能在无标注数据上学习到可转移的点云表示，提高了在分类和分割等下游任务的性能。研究发现，使用一张2D渲染图进行预训练能得到最佳效果。

摘要由CSDN通过智能技术生成

背景

论文主要贡献

背景

大规模人工标注的点云数据集由于其不规则性，在三维物体的分类、分割和检测等任务往往是费力的。Self-supervised学习，无需人为标注，是解决该问题的一个非常有前景的方法。在现实世界中，人类能够将从2D图像中学习到的视觉概念映射到3D世界中。受此启发，于是作者提出了CrossPoint，一种简单的跨模态对比学习方法，用于学习可转移的3D点云表示。

论文主要贡献

（1）使用2D-3D数据在自监督学习上做对比学习，有利于网络对点云的特征学习

（2）提出了端到端的自监督学习的目标封装intra-model以及cross-model损失函数，这使得2D图像特征能更好的嵌入到3D特征中，从而有效避免特定增强的偏差。

（3）将CrossPoint广泛应用到各种下游任务中，效果优于原先的无监督学习。

（4）在CIFAR-FS数据集上执行了少镜头的图像分类，以证明从CrossPoint调优预处理后的图像性能优于标准基线。(就是说加了图片对于点云后续任务更好)

相关工作

1. 点云的表征学习

由于点云的不规则结构以及在处理点数据时所需要的置换不变性，这使得对于点云的表征学习相对于其它的表征学习（例如图像）更为困难，有了深度学习在点云上直接应用的先锋——PointNet，众多点云深度学习网络诞生。尽管网络表现性能很好，但其依赖于有着人为标注信息的数据集，这类数据集是难以获取的。于是，CrossPoint的诞生，就是为了从一大堆无标注信息的数据中提取可转移的特征信息，并将其应用于下游任务——分类以及分割。