基于超图的聚类算法——基于一致图表达的鲁棒多视图聚类模型

最新推荐文章于 2024-07-15 22:10:26 发布

不易撞的网名

最新推荐文章于 2024-07-15 22:10:26 发布

阅读量778

点赞数 30

分类专栏：机器学习文章标签：算法聚类数据挖掘

本文链接：https://blog.csdn.net/weixin_50569789/article/details/140385972

版权

180 篇文章 0 订阅

订阅专栏

基于一致图表达的鲁棒多视图聚类模型（Robust Multi-view Clustering based on Consistent Graph Representation, RMC-CGR）是一种针对多视图数据的聚类方法。

这类数据集包含了来自不同角度或源的信息，例如，一个人脸识别系统可能同时使用颜色图像、深度图像和红外图像来识别同一个人。

RMC-CGR旨在从这些不同的视图中发现共同的聚类结构，同时处理数据中的噪声和异常值。

构建视图图：对于每个视图 $v$ ，构建一个相似性矩阵 $S_v$ 。这通常是通过计算视图 $v$ 中每对样本的相似度来完成的。常见的相似性度量包括欧氏距离、余弦相似度等。

低秩和稀疏分解：将每个视图的相似性矩阵分解为低秩部分 $L_v$ 和稀疏部分 $E_v$ 。低秩部分捕捉了数据的全局结构，而稀疏部分则吸收了噪声和异常值。这个分解可以通过求解以下优化问题来实现：

$\min_{L_v, E_v} \sum_v \lambda_v\|L_v\|_* + \mu_v\|E_v\|_1 \quad \text{s.t.} \quad S_v = L_v + E_v$

这里

$L_v\|_*$ 是矩阵 $L_v$ 的核范数
$E_v\|_1$ 是矩阵 $E_v$ 的 $l_1$ 范数
$\lambda_v$ 和 $\mu_v$ 是正则化参数。
一致性约束：引入一致性约束来确保所有视图的低秩表示 $L_v$ 之间的一致性。这通常通过最小化不同视图的低秩表示之间的差异来实现。一致性约束可以表示为：

$\min_{\{L_v\}} \sum_{v, u} w_{vu}\|L_v - L_u\|_F^2$

这里

$\sum_v w_v L_v$

这里， $w_v$ 是视图 $v$ 的权重。

谱聚类：将最终的聚类表示 $L$ 用于谱聚类算法，以得到最终的聚类结果。这通常涉及到计算 $L$ 的特征向量，然后使用 k-means 或其他聚类算法对这些特征向量进行聚类。

低秩和稀疏分解：此步骤的目标是分离出每个视图的全局结构（低秩部分）和异常值（稀疏部分）。低秩部分有助于捕捉数据的固有维度，而稀疏部分则过滤掉噪声和异常值，提高了聚类的鲁棒性。
一致性约束：确保不同视图的低秩表示之间的一致性，这有助于从多个角度理解数据，从而得到更可靠的聚类结果。
谱聚类：通过将最终的聚类表示转换为谱域，谱聚类算法可以在数据的低维嵌入上找到自然的分割，从而提高聚类的质量。

RMC-CGR模型通过结合多视图信息和鲁棒表示学习，能够有效处理复杂和不纯净的数据集，特别是在存在多种视图和噪声的情况下。

关注