基于谱聚类的稀疏子空间聚类方法(Sparse Subspace Clustering via Spectral Clustering, SSC-SC)

基于谱聚类的稀疏子空间聚类方法(Sparse Subspace Clustering via Spectral Clustering, SSC-SC)

引言

稀疏子空间聚类(Sparse Subspace Clustering, SSC)是一种先进的聚类方法,特别适用于处理高维数据,尤其是当数据点分布在多个低维子空间上时。

这种方法利用了数据的自表达属性,即数据点可以用其他数据点的线性组合表示,然后通过谱聚类技术将数据点分组到各自的子空间中。

稀疏子空间聚类原理

SSC假设数据点 X = [ x 1 , x 2 , … , x n ] X = [x_1, x_2, \dots, x_n] X=[x1,x2,,xn]来自多个低维子空间,目标是找到一个稀疏的自表达系数矩阵 Z Z Z,使得每个数据点都可以用其他数据点的稀疏组合来近似表示

这通常通过最小化以下目标函数实现:

min ⁡ Z 1 2 ∥ X − X Z ∥ F 2 + λ ∥ Z ∥ 1 subject to  Z i i = 0 , ∀ i \min_{Z} \frac{1}{2} \|X - XZ\|_F^2 + \lambda \|Z\|_1 \quad \text{subject to } Z_{ii} = 0, \forall i Zmin21XXZF2+λZ1subject to Zii=0,i

其中:

  • ∥ X − X Z ∥ F 2 \|X - XZ\|_F^2 XXZF2Frobenius范数,衡量原数据 X X X和其通过自表达矩阵 Z Z Z重构的版本之间的差异。
  • ∥ Z ∥ 1 \|Z\|_1 Z1是L1范数,用于促进 Z Z Z稀疏性,即大多数系数为零。
  • λ \lambda λ是正则化参数,用于平衡重构误差和稀疏性。
谱聚类

一旦得到自表达系数矩阵 Z Z Z,下一步是使用谱聚类将数据点分组到不同的子空间中。谱聚类通过分析 Z Z Z拉普拉斯矩阵 L L L的特征向量来实现数据点的分组, L L L可以定义为:

L = D − ∣ Z ∣ L = D - |Z| L=DZ

其中:

  • D D D是一个对角矩阵,其中 D i i = ∑ j ∣ Z i j ∣ D_{ii} = \sum_j |Z_{ij}| Dii=jZij,用于归一化每个节点的度数。
  • ∣ Z ∣ |Z| Z是对 Z Z Z取绝对值,以忽略自表达系数的符号。

谱聚类的关键步骤是:

  1. 计算 L L L的前 k k k特征向量,其中 k k k子空间的数量。
  2. 对这些特征向量进行归一化,形成一个新的矩阵 U U U
  3. U U U每一行视为一个新数据点,然后使用 k k k-means或其它聚类算法对这些新数据点进行聚类。
目标公式与解释

目标函数:

min ⁡ Z 1 2 ∥ X − X Z ∥ F 2 + λ ∥ Z ∥ 1 subject to  Z i i = 0 , ∀ i \min_{Z} \frac{1}{2} \|X - XZ\|_F^2 + \lambda \|Z\|_1 \quad \text{subject to } Z_{ii} = 0, \forall i Zmin21XXZF2+λZ1subject to Zii=0,i

  • ∥ X − X Z ∥ F 2 \|X - XZ\|_F^2 XXZF2:确保 X X X能够通过 Z Z Z表示的线性组合尽可能准确地重构。
  • ∥ Z ∥ 1 \|Z\|_1 Z1:鼓励 Z Z Z稀疏,即每个数据点最好只用少数几个其他数据点的线性组合来表示。
  • Z i i = 0 Z_{ii} = 0 Zii=0:确保数据点不会用自己表示,避免了自回归问题。

谱聚类中的拉普拉斯矩阵 L L L

L = D − ∣ Z ∣ L = D - |Z| L=DZ

  • D D D度矩阵,表示每个数据点作为线性组合中的一部分的总权重。
  • ∣ Z ∣ |Z| Z:取 Z Z Z的绝对值,去除自表达系数的符号影响,仅关注权重。
结论

基于谱聚类的稀疏子空间聚类方法(SSC-SC)是一种强大的工具,用于处理复杂的数据集,特别是那些分布在多个低维子空间上的高维数据。

通过结合稀疏表示和谱聚类技术,SSC-SC能够有效地识别和分离出数据点所属的不同子空间,从而实现准确的聚类。这种方法在图像分析、视频处理、生物信息学等多个领域都有着广泛的应用。

  • 16
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

不易撞的网名

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值