论文阅读”Efficient Deep Embedded Subspace Clustering“(CVPR2022)

论文标题

Efficient Deep Embedded Subspace Clustering

论文作者、链接

作者:

Cai, Jinyu and Fan, Jicong and Guo, Wenzhong and Wang, Shiping and Zhang, Yunhe and Zhang, Zhao

链接:CVPR 2022 Open Access Repository


Introduction逻辑(论文动机&现有工作存在的问题)

聚类——传统聚类,难以处理结构复杂或是高维数据——通过特征学习技术来学习聚类的低维嵌入,以提高聚类的准确性,但是难以保证学到的特征是有利于聚类的

端到端的聚类算法,聚类目标和网络优化的过程结合起来,提供了一种学习基于聚类的嵌入表达的方法——往往使用欧式距离来衡量和辨别簇,但是在不同类型数据面前欧式距离不是常常有效

子空间聚类——假设数据在不同的子空间中——将子空间聚类和深度聚类的结合,时空复杂度很高

论文核心创新点

提出了一个深度子空间聚类的方法,跳脱出卷积自表示框架

本文方法的时空复杂度是线性增长的

可以应用于在线聚类

分析了利用深度神经网络将基于距离的聚类和基于子空间的聚类进行转换的可行性


相关工作

深度聚类

子空间聚类


论文方法

 问题定义

问题1:给一个数据矩阵\bold{X} \in \mathbb{R}^{m \times n},其中m代表特征个数以及n代表样本个数。假设有\bold{X}=\bold{\overline{X}P},其中\overline{\mathbf{X}} = \left[\overline{\mathbf{X}}^{(1)}, \overline{\mathbf{X}}^{(2)}, \ldots, \overline{\mathbf{X}}^{(k)}\right]以及\bold{P} \in \mathbb{R}^{n \times n}是一个未知的置换矩阵。对于j=1,\dots,k,假设\bold{\overline{X}}^{(j)}\in \mathbb{R}^{m \times n_j}的列,由\bold{x}=\bold{f_j(v)}+\varepsilon生成,其中\mathbf{f}_{j}: \mathbb{R}^{r_{k}} \longrightarrow \mathbb{R}^{m}是未知的非线性函数,r_j < m以及\bold{v} \in \mathbb{R}^{r_j}是随机变量,\varepsilon \in \mathbb{R}^m是随机的高斯噪声。问题目标是从\bold{X}中找到置换矩阵\bold{P}

 问题1其实也是一个聚类问题,对于需要将\bold{X}的每一列分到k个簇中,通过k个不同的函数f_1,\cdots,f_k。图2演示了问题1的一种简单情况。值得注意的是,这些函数都是线性的,这个问题可以归结为经典的子空间聚类。

问题2:在问题1中,对于j=1,\dots,k假设有\mathbf{f}_{j}(\mathbf{v})=\mathbf{g}\left(\mathbf{B}^{(j)} \mathbf{v}\right)其中\text {, where } \mathbf{B}^{(j)} \in \mathbb{R}^{p \times r_{j}}\mathbf{g}: \mathbb{R}^{p} \longrightarrow \mathbb{R}^{m}。此外,\frac{\left\|\mathbf{B}^{(i)} \mathbf{B}^{(j)}\right\|_{F}}{\left\|\mathbf{B}^{(i)}\right\|_{F}\left\|\mathbf{B}^{(j)}\right\|_{F}}(i \neq j)是足够小的。问题目标是从\bold{X}中找到置换矩阵\bold{P}

经过一系列演算,最终的目标函数变成了,如下所示:

 在公式8中,\bold{z}_i是一个中间变量,不需要去显式地优化它。公式8中的第一项约束,是控制\bold{D}的列的尺寸,否则\left\|\mathbf{Z}_{i}^{\top} \mathbf{D}^{\left(\alpha_{i}\right)}\right\|可能为0。第二个约束是满足问题1中不同子空间之间不相似的假设。最后一个约束起着子空间分配的作用。

问题的可行解决方案

为了方便,使得

 将公式8的第一个约束变成如下的目标函数:

其中,\odot表示哈达玛积,\bold{I}是一个尺寸为kd \times kd的单位矩阵。

将公式8的第二个约束变成如下的目标函数:

 其中\bold{O}是所有的d尺寸的对角矩阵的元素都是0,其他元素全为1的矩阵。将上面的两个约束结合到一起有:

 其中\xi是一个超参,设为10^{-3}

对公式8的第三个约束,提出一个子空间矩阵S

来衡量 嵌入特征\bold{Z}和子空间基代理\bold{D}之间的关系:

 其中\eta是控制平滑度的参数。因此,s_{ij}表示嵌入特征\bold{z}_i属于第j个子空间\bold{D}^{(j)}的概率。进一步对子空间矩阵\tilde{S}进行细化,有:

 \tilde{S}的目标是强调S中的高置信度的分布。换句话说,\tilde{S}可以作为自监督信息,于是得到一下的子空间聚类目标函数:

 于是定义一个无约束版本的公式8为:


消融实验设计

损失函数每一项的影响分析


一句话总结

模型本身很简单,效果好像还行,但是没开源代码

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值