深度聚类与无监督特征学习在点云分析中的应用-CSDN博客

本文链接：https://blog.csdn.net/weixin_45657478/article/details/125817436

一、Deep Clustering for Unsupervised Learning of Visual Features

原文链接：https://arxiv.org/pdf/1807.05520.pdf

完全不需要标签的无监督学习方法，好像是为了学习好的特征表达（当然下游任务肯定需要标签）。

网络结构

将所有 $N$ 个输入图像输入卷积神经网络得到表达（或特征）（设输入 $x_n$ 对应的输出 $f_\theta(x_n)$ ）。然后输入到两个分支：分类分支和聚类分支。

聚类分支先用某种方式聚类（如K-means），得到每张图片的“伪标签” $y_n=[0,\cdots,0,1,0,\cdots,0]$ ，并计算聚类损失（ $C$ 为待学习的参数矩阵）：

$\min_{C\in \mathbb{R}^{d\times k}}\frac{1}{N}\sum_{n=1}^N\min_{y_n\in\{0,1\}^k}\left \| f_\theta(x_n)-Cy_n \right \|^2_2$

其中 $y_n^T\mathbf{1}_k=1$ 。

分类分支则利用分类头（ $g_W$ ）预测结果，与伪标签比较，计算得到分类损失（log-softmax）：

$\min_{\theta,W}\frac{1}{N}\sum_{n=1}^Nl(g_W(f_\theta(x_n)),y_n)$

为防止出现平凡解：当一个簇 $B$ 为空时，随机选择一个非空簇 $A$ ，并使用带有小随机扰动的质心作为空簇 $B$ 的新质心。然后，将属于非空簇 $A$ 的点重新分配给两个结果簇（ $A$ 和 $B$ ）；对输入数据进行重新采样使得分布均匀。

若下游任务为图像分类，则丢掉上面的分类和聚类分支，加入新的分类头并微调。

二、ClusterNet: Deep Hierarchical Cluster Network with Rigorously Rotation- Invariant Representation for Point Cloud Analysis

原文链接：ClusterNet: Deep Hierarchical Cluster Network With Rigorously Rotation-Invariant Representation for Point Cloud Analysis | IEEE Conference Publication | IEEE Xplore

严格旋转不变（RRI）映射 $F$ 满足： $F(S)=F(R(S))$ 且映射前后点数不变。其中 $S$ 为点的集合（点云）， $R$ 为任一旋转变换。

采用如下点的表达：

$p_i=(r_i,(r_{i1},\theta_{i1},\phi_{i1}),(r_{i2},\theta_{i2},\phi_{i2}),\cdots,(r_{iK},\theta_{iK},\phi_{iK}))$ 。

其中 $p_{ik}$ 为 $p_i$ 的K近邻点之一，序号为 $k$ ； $(r_{ik},\theta_{ik},\phi_{ik})$ 分别为 $l_2$ -norm、 $T$ 变换前夹角、 $T$ 变换后夹角的最小值；变换 $T$ 为到平面 $L_i$ （与 $p_i$ 正交的平面）的正交投影变换。

本文证明了：（a）上述表达为RRI的；（b）该表达可以重建点云（即除旋转信息以外不损失信息）。

将上述表达重新表示为

$p_i=(\underbrace{(r_i,r_{i1},\theta_{i1},\phi_{i1})}_{T_{i1}},\underbrace{(r_i,r_{i2},\theta_{i2},\phi_{i2})}_{T_{i2}},\cdots,\underbrace{(r_i,r_{iK},\theta_{iK},\phi_{iK})}_{T_{iK}})$